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Presentacion a la quinta edicion 



Esta publication , como las cuatro ediciones anteriores , comiene los nietodos 
de la experimentacion estadistica y la teoria de la probabihdad dando enfasis a las 
aplicaciones de manera que sirva a la formacion basica que debe tenet un 
estudiante de cualquier especialidad [ y que sirva tambien, como fuente de consulta 
para profesionales de diverscis disciplinas del saber. 

Una de las grandes ventajas de este libro es la inclusion de nnmerosos 
ejemplos y ejercicios , algunos de ellos casos del mundo real , y que estimulan la 
curiosidad ciennfica del lector permitiendo realizar unci adecuada organization, 
presentation y analisis de los datos que se obtienen de la experimentation. 

Se pretende que los ejercicios con datos experimentales conduzca al alumna a 
la formulae ion de modelos de probabilidad y de regresion. Para esto y virus 
problemas de apliccicion , el autor le brinda el software MCEST cuyos resultados 
son compatibles con los de los paquetes de coniputo SPSS, ESTADISTICA . EXCEL 
MINITAB y otros. 

El libro contiene 10 capitulos. En los tres primeros. se introduce los nietodos 
descriptivos , como tabulation de datos en distribution de free uencicis, medidas de 
tendencia central de dispersion asimetria v curtosis. El capitulo 4 esta dediccido a 
unci introduce ion al e studio de la regresion lineal simple en la forma descriptiva y 
los mtmeros indices. El capitulo 5 trata del calculo de probabilidades Los 
capitulos 6 y 7 constituyen una presentation basica de las variables cileatorias y 
distribuciones de probabilidades especiales. En los capitulos 8 9 y 10 se hace unci 
introduction a la inferencia estadistica dando ideas bdsicas sobre estimcicion x 
pruebas de lupotesis 

Estoy mux agradecido par la acogida que recibe esta publication, y me motiva 
entonces a realizar una revision pemuinente del texto amp Hondo sus aplicaciones. 
Quiero expresar tambien mi agrcidecimiento a la Pontificia Universidad Catolica 
del Peru por pernutirme realizar este trabajo fruto de mi experiencia en sus aulas. 
A mis alumnos de Estudios Generates Ciencias, Estudios Generates Letrcis, 
Ciencias Administrative is y Contcibilidad. Asi mismo expreso mi agrcidecimiento a 
todos los cole gas de Lima y provincias por la aplicacion clel texto, el mismo que se 
ajustci a los programas de los cursos de Estadistica General que forma parte de los 
planes de estudio de las Universtdades e Institutos Superiores. 

Lima , Enero del 2003 
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Capitulo 1 



NOCIONES DE ESTADISTICA DESCRIPTIVA 



1.1 Estadfstica 

La palabra estadfstica se emplea en una gran variedad de formas. En plural se 
emplea como sinonimo de dato. 

El trabajo estadistico o la investigation estadfstica es un proceso que pasa 
generalmente por las siguientes etapas: 

- Formulation del problema o la tarea , 

- Diseno del experimento. 

- Recop ilac ion de los datos. 

- Clasificaciom tabulation y description de resuliados. 

- Generalization o inferencia. 

Definition. En este lexio basico, definimos la estadfstica, como la ciencia que nos 
proporciona un conjunto de metodos, tecnicas o procedimientos para: 

- re co pilar, 

- organizar ( clasificar, agrupar), 

- presentar, y 

- analizar, 

datos con el fin de describirlos o de realizar general izaciones validas. 

Se denomina estadfstica descriptiva , al conjunto de metodos estadisucos que 
se relacionan con el resumen y descripcion de los datos, como tablas, graficas, y el 
analisis mediante algunos calculos. 
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Se denomina inferencia estadistica al conjunlo de metodos con los que se 
hacen la generalization o la inferencia sobre una poblacion utilizando una muestra. 
La inferencia puede contener conclusiones que pueden no ser ciertas en forma 
absoluta, por lo que es necesario que estas sean dadas con una medida de 
confiabilidad que es la probabilidad. 

Estas dos partes de la estadistica no son mutuamente excluyentes, ya que para 
utilizar los metodos de la inferencia estadistica, se requiere cofiocer los metodos de 
la estadistica descriptiva. 



1.2 Poblacion y muestra 

Poblacion 

Definicion. En forma general, en estadfstica; se denomina poblacion, a un conjunto 
de elementos (que consiste de personas, objetos, etc.), que contienen una o mas 
caracteristicas observables de naturaleza cualitativa o cuantitativa que se pueden 
medir en ellos. 

A cada elemento de una poblacion se denomina unidad elemental o unidad 
estadistica. 

Por ejemplo, los empleados de una empresa en un diVlaborable, constituyen una 
poblacion en la que cada empleado (unidad estadistica), tiene muchas 
caracteristicas a ser observadas, como por ejemplo: sexo, estado civil, lugar de 
procedencia, grado de instruccion, etc. (caracteristicas cualitativas), o numero de 
hijos, ingresos mensuales, etc.(caracterfsticas cuantitativas). 

El resultado de medir una caracteristica observable de una unidad elemental, se 
denomina dato estadfstico o valor observado o simplemente observation. 

Por otra parte, la poblacion; viene definida por la tarea o investigation 
estadistica a realizarse. Y como la medicion o conteo de la caracteristica 
especificada por la investigation se hace a cada unidad elemental, se puede 
considerar a la poblacion como la totalidad de valor es posibles de una 
caracteristica particular especificada por la investigation estadistica. En este sentido 
la poblacion consiste de un conjunto de datos estadfsticos que se reunen de acuerdo 
con la formulacion de una investigation estadistica o con la definicion de la 
poblacion especifica. 

Parametro: Se denomina parametro a una medida descriptiva que resuma una 
caracteristica de la poblacion, tal como la media ( \x ) o la varianza ( c“ ), calculada 
a partir de los datos observados de toda la poblacion 

Tipos de poblacion: Por el numero de elementos que la componen, la 
poblacion se clasifica en finita o infinita. La poblacion es finita si tiene un numero 
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fimto de elementos. En caso contrario la poblacion es infinita En la practica una 
poblacion finita con un numero grande de elementos se considera como una 
poblacion infinita. 

Muestra 

Despues de definir la investigacion estadfstica a realizar, se debe decidir entre 
investigar toda la poblacion o solo una parte de ella. El primer procedimiento es 
denominado censo y el segundo es llamado muestreo. 

Definition. Se denomina muestra a una parte de la poblacion seleccionada de 
acuerdo con un plan o regia, con el fin de obtener information acerca de la 
poblacion de la cual proviene. 

La muestra debe ser seleccionada de manera que sea representativa de la 
poblacion. Un metodo de selection de muestras representativas es al azar simple , 
esto es, cada elemento de la poblacion tiene la misma posibilidad de ser 
seleccionada para la muestra. 

Estadistica O estadlgrafo. Se denomina estadistica a una medida 
descriptiva que resuma una caracterfstica de la muestra, tal como la media ( 3c ) o la 
varianza ( s z ) calculada a partir de los datos observados de una muestra aleatoria. 

Es importante tener en cuenta, si el analisis estadfstico se esta haciendo con una 
muestra o con una poblacion En ambos casos las medidas descriptivas son las 
mismas. Para diferenciarlos, los parametros de la poblacion, se representan por 
letras griegas. 



1.3 Variables estadisticas 

La caracterfstica que se mida en las unidades elementales de una poblacion 
definida por la tarea estadistica, tiene diversos valores de naturaleza cualitativa o 
cuantitativa. Por ejemplo, la caracterfstica "sexo" tiene dos modalidades: hombre y 
mujer, la caracterfstica "peso en kilogramos" tiene infinitos valores. 

Definition: Se denomina variable estadistica a una caracterfstica definida en la 
poblacion por la tarea o investigacion estadistica, que puede tomar dos o mas 
valores (cualidades o numeros). 

Se representa por una letra del alfabeto. Por ejemplo, en la poblacion 
constituida por los empleados de la universidad, algunas variables estadisticas 
definidas en esta poblacion son: 

X: ”sexo". Valores: Masculino, Femenino 
Y : "estado civil". Valores: Soltero, casado, viudo, divorciado 
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Z: "numero de hijos", Valores: 0,1,2, etc. 

W: "ingresos mensuales", Valores: Numeros reales positivos. 




( cualidad 
cantidad 



Si una variable se denota por X , entonces, sus valores observados en n unidades 
estadfsticas se denotan por Jt, , ;t 2 , conforme al orden en que se han 

obtenido. Este conjunto de n observaciones constituye una muestra de tamaho n 
obtenida de una poblacion 



1.3.1 Escalas de medicion 

La asignacion de valores a cada una de las unidades estadfsticas mediante una 
variable, se hace siguiendo determinadas escalas de medicion. 

Definition. Se denomina escala de medicion a un instrumento de medida, con el 
que se asigna valores (cualidades o numeros) a las unidades estadfsticas para una 
variable definida. 

El conocimiento de las escalas de medicion es mu> imponante. pues cada una 
de ellas tienen metodos estadfsticos especfficos. 

Las escalas de medicion son de los siguientes tipos: 

* Nominal 

* Ordinal 

* De intervalosy y 

* De razones . 



Escala nominal 

Definicion: Se tiene una escala nominal si dos o mas valores de una variable 
s61o permiten percibir las diferencias o semejanzas de las unidades estadfsticas que 
se mxdan Tales valores son como etiquetas que identifican a las unidades 
estadfsticas y las hacen iguales o diferentes entre si. 
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Si se asignan numeros a estos valores cualitativos (modalidades), con estos no se 
pueden realizar operaciones aritmeticas. Solo son validas las relaciones de igualdad 
(=) y no igualdad (*). 

Por ejemplo, la variable "sexo" asigna a las personas dos valores: "masculino" 
y "femenino" que son de escala nominal Con los valores de esta variable las 
personas estan en una misma modalidad o en modalidades diferentes Si se 
asigna un "cero" al sexo ’'masculino” y un "uno ' al sexo femenino, con estos 
numeros, no se pueden realizar operaciones aritmeticas. Solo se puede decir que el 
sfmbolo 0 es distinto al sfmbolo 1 , pero no podemos decir que 1 es mayor que 0, o 
que 0 es menor que 1. Las variables estadfsticas: "estado civil”, "ideas religiosas”, 
entre otras, tienen modalidades que son de escala nominal. 

El metodo estadistico con datos obtenidos en escala nominal consiste 
basicamente en obtener el numero o porcentaje de casos en cada modalidad y 
obtener la moda (valor de mayor frecuencia) 



Escala ordinal 

Definition: Una escala ordinal es una escala nominal donde los valores de la 
variable se pueden ordenar en forma ascendente (o descendente). 

En una escala ordinal los valores o modalidades reflejan el orden de las unidades 
estadfsticas. Si se asignan numeros a tales modalidades, con estos, no se pueden 
realizar operaciones aritmeticas. Solo son validas las relaciones de igualdad (=), de 
no igualdad (*) y de orden (<). 

Por ejemplo, la variable "estatus socioeconomico" con sus modalidades: clase 
baja, media y alta se mide, en escala ordinal. La variable "orden de merito" cuyas 
modalidades son 1°, 2°, 3°, etc. mide las calificaciones de las unidades estadfsticas 
en escala ordinal. 

El metoda estadistico con datos obtenidos enescala ordinal consiste basicamente 
ea ahteneneLnumero o porcentaje de casos encada modalidad y obtenpr lajpoda, la 
mediana, los percentiles y el coeficiente d^correlacidn p or ra ngos. 

Escala de intervalos 

Deflnicion: Una escala de intervalos es una escala ordinal con cuyos "valores" 
no solo se pueden verificar igualdad , no igualdad y orden, si no tambien, se puede 
elegir una unidad de escala y comprobar cu&ntas veces la diferencia entre dos 
valores es igual a la diferencia entre otros dos valores de la escala (es decir. 
podemos comparar intervalos). 

Esto es, si Xj , x 2 y x 3 son tres valores en la escala de intervalo, se verifica, 
por ejemplo, la relacion: 
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JC 3 - JC, 

JC 3 - JC, = C(JC 2 - JC,) O = C 

JC 2 - JC, 

donde c es una constante. 

Esta relation se interpreta como que la escala de intervalos tiene un "cero 
relative 1 '. Este cero no significa ausencia total de la propiedad que se observa. 

Se miden en escala de intervalos, por ejemplo, la temperatura (grados Celsius o 
Fahrenheit), el tiempo que se registra en nuestros calendarios, las calificaciones de 
una prueba de conocimientos o de aptiiud. Estas mediciones tienen un cero elegido 
arbitrariamente, por ejemplo, el agua se congcla a 0°C(=32°F). La calificacion 
“cero” de un alumno en un examen de matematica basica. no quiere decir que no 
sabe nada de tal materia, pues con otra prueba mas facil podria tener otra 
calificacion. 

Con los valores de esta escala son validas las relaciones de igualdad. de no 
igualdad y de orden. Tambien, son validas las operacione s de adicion y sustraccion 
entre lo s valores de la escala, y la multiplication y division entre las diferencias dc 
dos valores de la escala. Penx no es v£lida la multiplicacion y division entre los 
valores mismos de la escala. 

Por ejemplo, si la variable X es "puntaje" obtenido en un examen calificado de 
2 a 20 donde la unidad de medida es un punto a partir de 2 (cero rclativo), enionces, 
se tiene una escala de intervalos. En efecto, si tres alumnos A, B, y C han obtenido 
los puntajes: 2, 4 y 16 respectivamente, no solo se verifican las relaciones 
2*4* 16y2<4< 16, sino tambien: 16 - 2 = 7(4 - 2); es decir la diferencia de los 
puntajes de C menos A es igual a siete veces la diferencia de los puntajes de B 
menos A. No es valida la division 16/4, pero si lo es. (16-2)/(4-2). 

Propiedad: Una escala de intervalo Jt permanece mvariante ante la 
transformacion: 

v = ax + b 

donde ay b son constantes arbitrarias. Esto se debe a que son arbitrarios tanto el 
origen como la unidad de medida, 

Por ejemplo. si la variable X tiene valores: 2. 4 y 16 que se miden en escala de 
intervalos, entonces, la transformacion: K = 3X-3, que produce los valores 

respectivos 3. 9 y 45. es la misma escala de intervalos Es decir, estos dos juegos 
de valores 2. 4, 16. v 3, 9. 45 miden las misma caracterfstica y verifican las 
mismas relaciones: 

2*4*16, 2<4< 1 6, 16-2=7(4-2), y 

3*9*45, 3<9<45. 45-3=7(9-3) 

En particular ’ — — - = 7 = — — - 

4-2 9-3 
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Escala de razon o cociente 

Definicion. La escala de razon es una escala de intervalo con cuyos valores 
adem&s podemos comprobar cuantas veces un valor de la escala es igual a otro 
valor de la escala, Esto es, si x x y x 2 son dos valores en la escala de razon, se 

X-y 

venfica la relacion: x 2 - cx } o — - = c , 

donde c es una constante, y x x ^ 0 . 

La escala de razon tiene un cero absoluto (ausencia total de la caractenstica que 
se observa). Con los numeros de esta escala son vdlidas las relaciones de igualdad, 
de no igualdad. de orden y todas las operaciones matematicas. Los valores de esta 
escala se obtienen en general, por mediciones tipo conteo (discretos) o por 
mediciones tales como de longitud, peso, volumen, vida util, etc. (contmuos). 

Por ejemplo, si la variable X, es la longitud fen metros) de un objeto, entonces, 
los valores de esta variable son de escala de razon. En efecto, si tres objetos A, B, y 
C miden 2, 4 y 16 metros, se pueden establecer las relaciones: 2^4^16, 2 < 4 < 16, 
16 - 2 = 7(4 - 2), ademas, 4/2 = 2, 1 6/2 = 8, y 16/4 = 4. Es decir, la longitud de B 
es el doble que la de A, el de C es 8 veces que la de A y el de C es 4 veces que la de B. 

Propiedad: Una escala de razon x permanece invariante ante la transformacion: 

y- ax 

donde a es una constante arbitraria. 

Por ejemplo, si la variable X: tiene valores 4 y 16 medidos en escala de razon, 
entonces. la transformacion Y = (1 / 2)X que produce los valores respectivos 2 y 8 

es la misma escala de razon. Es decir, estos dos juegos de valores 4, 16 y 2, 8. 
miden las misma caractenstica y verifican las mismas relaciones, en particular: 

16 _ 8 . 

4 2 

Por dar otro ejemplo, si el ingreso mensual de una persona se expresa en 
soles (jc) o en dolares (y)» entonces se cumple la relacion: y = (1 /3.5)x , donde 3.5 
es el tipo de cambio. 

NOTA. La aplicacion de metodos estadisticos cuantitativos requieren que la 
variable se mida por lo menos en escala de intervalos. 

EJEMPLO LO 

Las notas de un cierto curso se miden en una escala de intervalos de 0 a 20. Por 
razones practicas se trata de expresar estas notas en la misma escala de intervalos 
pero de tal manera que el 20 se transforme en 100 y el 15 se transforme en 80, ^en 
cu&nto debe transformarse el 0? 
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SOLUCION 

Sea ? el valor que corresponde al O.Entonces, si 0, 15, 20 y ?, 80, 100 son dos 
juegos de valores en la misma escala de imervalos, entonces, 

?— 80 0 — 15 

— I = de donde resulta ? = 20. 

80-100 15-20 



1.3.2 Clasificacion de variables. 

Las variables se clasifican en cualitativas y cuantitativas Las variables 
cuantitativas se clasifican en discretas y continuas 

Variable cualitativa, es la caracteristica cuyos valores se expresan en escalas 
nominal u ordinal, por ejempio, sexo , profesion ,estado civil, orden de meritos. 
etc.. Con sus valores, que son cualidades, no se pueden realizar operaciones 
aritmeticas. 

Variable cuantitativa, es la caracteristica cuyos valores se expresan en 
escalas de intervalo o de razon. por ejempio, temperatura, numero de hijos. 
ingresos mensuales, tiempo de vida util, etc.. Con sus valores, que son numeros. se 
pueden realizar operaciones aritmeticas. 

Las variables cuantitativas, a su vez, se clasifican en: discretas , v 
continuas . 

Variable discreta, es aquella variable cuantitativa que puede tomar solo 
ciertos valores en un intervalo considerado y no admite ningun valor entre dos 
valores consecutivos fijos. Generalmente, es una variable cuyos valores se obtienen 
por conteo (numeros naturales). For ejempio, una familia puede tener 0.1,2... .hijos. 
pero no algun valor intermedio. 

Variable continua, es aquella variable cuantitativa que puede tomar cualquier 
valor en el intervalo considerado, por ejempio, salario, tiempo, peso, volumen. 
longnud. etc.. 

La distincion entre variable discreta y continua es mas teorica que real. Al utilizar 
los datos, la variable siempre resulta discreta, pues toda medicion se expresa solo en 
ciertas umdades realmente medibles, por decir, metros, decimetros. centimetros. Por 
ejempio, es posible que una persona mida 1.6748m, o, 1.6752m, pero para fines 
practicos, redondeando a dos decimales, se considera solo 1.67m., o, 1.68m 
respectivamente. 
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Una variable continua puede pues tomar infinitos valores intermedios en un 
imervalo dado. Para fines practicos los valores numericos de las variables 
continuas siempre son valores aproximados. 



1.4 Organizacion de los datos: 

Distribution de frecuencias. 

Despues de la recopilacion de los datos, es necesano resumirlos y presentarlos 
en forma tab que faciliten su comprension y su posterior analisis y utilizacion. Para 
ello, se ordenan en cuadros numericos y luego se representan en grdficos. 

Existen muchos paquetes de computo estadisticos para organizar datos. Uno de 
estos es el paquete estadistico MCEST creado por el autor de este texto. 

Todo cuadro numerico debe tener: 

-Un titulo adecuado para evitar confusiones y para expresar brevemente su 
contenido. 

-La fuente de los datos. si no son datos propios. 

-Las umdades en que se expresan los datos. 

Los cuadros numericos de una sola variable estadistica se denominan 
distribution de frecuencias 

En el procedimiento para construir distribuciones de frecuencias nos 
referiremos a muestras , mientras no se diga lo contrario. 



1.4.1 Distribution de frecuencias: Variable cualitativa 

Supongamos que en una muestra de n unidades estadfsticas se observan A 
categorias o modalidades diferentes de alguna variable cualitativa X. 

La tabulation de estos n datos, es la distribution de frecuencias por categorias del 
cuadro 1-1 

La frecuencia absoluta f, es el numero de datos observados en cada eategoria o 
modal idad. La $uma de todas las frecuencias absolutas es igual al total n de 

datos observados. 

La frecuencia relativa h, se define en cada eategoria por = fjn . La suma 
de todas las frecuencias relativas es igual a uno 
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La frecuencia porcentaje p x se define en cada fila por p x - x 100% . El 
total de las frecuencias porcentajes es igual a cien. 

Cuadro 1.1. Distribution de frecuencias de variable cualitcitiva 



Categorias de la 
Variable X 


Frecuencias 
Absolutas / z 


Frecuencias 
Relativas h { 


Frecuencias 

Porcentajes 


c, 


/, 




p i 


c 2 


fi 


^2 


P 2 


C* 


h 


K 


Pk 


Total 


n 


LOO 


100.00 



Grafica. 

Existe una gran variedad de graficas para la distribution de frecuencias de 
variable cualitativa, las mas comunes son la de barras y la de sectores circulares. 

En una grafica de barras los datos de cada una de las modalidades C t se 
representan por una barra rectangular vertical (u horizontal), cuya altura (o largo) es 
proporcional a su frecuencia. Las barras se dibujan dejando un espacio entre ellas. 

Si la escala es nominal las categories pueden ser colocadas en cualquier orden. 
Pero, si el nivef es ordinal las categorias deben ir ordenadas. 

En una grafica circular, los datos de cada categoria C f se representan por un 
sector circular cuyo angulo en el centro es igual a /2;x360°. 

Si la grafica por sectores circulares es tridimensional es denominada de pastel. 

EJEMPLO 1.1. 

En una encuesta de opinion acerca de las preferences de una marca de bebida 
gaseosa por sus colores: Negro(N), Blanco(B), Rojo(R), 20 consumidores dieron las 
siguientes respuestas: 

B, N, N, B, R, N, N, B, B. N, 

B, N, N, R. B, N, B, R, B. N. 

Construir la distribucion de frecuencias. Graficar la distribucion 

SOLUCION. 

La tabulacion de estos datos, donde la variable cualitativa es X : Color de bebida 
gaseosa, es la distribucion de frecuencias del cuadro 1.2. 
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La figura 1 . 1 es la representation grafica por medio de barras de la distribution 
de personas por el color de su bebida gaseosa preferida. 

Cuadro 1.2. Distribution de personas por su color preferido de una marca 



de bebida gaseosa. 



Valores de 
X 


Frecuencias 
Absolutas: f i 


Frecuencias 
Relativas: h i 


Frecuencias 
Porcentajes; p i 


Negro (N) 


9 


0.45 


45 


Blanco (B) 


8 


0.40 


40 


Rojo (R) 


3 


0.15 


15 


Total 


20 


1.00 


100 



Personas 




Fig. 1.1 Grafica de barras 

La figura 1.2 es la representation mediante grafica de sectores circulares del 
cuadro 1.2. La frecuencia 45% es equivalente a 0.45 x 360°= 162°, la frecuencia 
40% es equivalente a 0.40 x 360°= 144°, y la frecuencia 15% es equivalente a 
0.15x360°= 54° 




Fig. 1.2 Grafica circular 
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1.4.2 Distribution de frecuencias: 

Variable cuantitativa discreta 

Suponga que se han recolectado n valores de alguna variable discreta X. El 
procedimiento mas simple de organizar estos n datos, consiste en ordenar estos 
valores numericos en forma ascendente. 

Si todos los n datos son distintos entre si, se obtendra una distribucion de 
frecuencias de n valores de la variable X> donde cada uno de estos valores tienen 
frecuencia absoluta igual a uno. 

Si algunos valores se repiten, y si al terminar el ordenamiento se obtienen k 
(k <n) valores distintos de X, digamos, x k , con frecuencias absolutas 

respectivas /,,/ 2 distribucion de frecuencias de estos n datos se resume 
en el cuadro 1 .3 (observar que es similar al cuadro 1 1 ). 



Cuadro 1.3. Distribucion de frecuencias de variable discreta 



Valores de 
La variable X 


Frecuencias 
Absolutas f t 


Frecuencias 
Relativas h x 


Frecuencias 
Porcentajes p t 


Xf 


/, 




p\ 


X . 2 






Pi 


** 


/* 


h k 


Pk 


Total 


n 


LOO 


100.00 



Las frecuencias absolutas relativas y porcentajes poseen , en el caso de variable 
discreta y continua. el mismo significado y propiedades, que en el caso de la 
variable cualitativa. 

Cuando es grande el numero de datos observados de una variable discreta. su 
organizacion es muy engorrosa. En este caso, para resumir los datos y poder 
calcular las medidas descriptivas, es conveniente seguir el metodo de organizacion 
de variable continua por intervalos que se describe on la seccion 1.4.3 siguiente 

Grafica 

La representacion grafica mas comun de una distribucion de frecuencias de 
variable discreta es del tipo baston que consiste en trazar en cada valor distinto de 
la variable, segmentos de recta proporcionales a su frecuencia. 

Tambien, se pueden usar barras rectangulares para graficar una distribucion de 
frecuencias de variable discreta 

EJEMPLO 1.2- 

Ante la pregunta del numero de hijos por familia (variable X) una muestra de 20 
hogares, marco las siguientes respuestas: 



www.FreeLibros.me 



Distribution de frecuencias 



13 



2. 1, 2. 4. 1.3. 2. 3, 2, 0. 

3,2, 1,3. 2, 3, 3. 1,2, 4. 

Construir la distribucion de frecuencias de la variable X. Graficar. 

SOLUCION. 

A1 ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 
0, 1, 2, 3, 4 que se repiten respeclivamente 1, 4, 7, 6, 2 veces. La distribucion de 
frecuencias de X se da en el cuadro 1 .4. 



Cuadro 1.4. Distribucion de frecuencias del numero de hijos por familia 



Numero de 
Hijos 
Xi 


Frecuencias 

Absolutas 

ft 


Frecuencias 

relativas 

h 


Frecuencias 

porcentajes 

Pi 


0 


1 


0.05 


5 


1 


4 


0.20 


20 


2 


7 


0.35 


35 


3 


6 


0.30 


30 


4 


2 


0.10 


10 


Total 


20 


1.00 


100 



La grafica de bastones es la figura 1 3 




Figura 1.3. Grafica de baston 

En la grafica de bastones, figura 1.3, se indican las frecuencias absolutas v 
relativas en cada valor distinto de la variable 
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1.4.3 Distribution de frecuencias por intervalos 

La distribution de frecuencias por intervalos o clases se usa cuando la variable 
estadistica es continua o cuando el numero de valores distintos de una variable 
discreta es muy grande (mas de 20 lmeas en el monitor de una computadora) 

Esta distribution se obtiene dividiendo el rango de variation de los datos en k 
intervalos y determinando el numero de datos que contiene cada intervalo (Cuadro 
15). 



Cuadro 1.5. Distribution de frecuencias por intervalos 



Intervalos / f - 


Conteo 


Frecuencias 


Absolutas /• 


Relativas h i 


Porcentajes p i 




///... 


fi 




p i 


h 


/// 


f 2 


h , 


Pi 


h 


///... 


fk 


K 


Pk 


Total 




n 


1.00 


100.00 



Para construir la distribution de frecuencias de intervalos hay varios 
procedimientos. En este texto se conviene y recomienda: 

Rl. Elegir no mas de 20 intervalos ni menos de 5, ya que muchos intervalos 
pueden complicar innecesariamente los calculos de las medidas descnptivas, y 
pocos intervalos podrian omitir caracteristicas importantes de los datos. En este 
texto elegimos todos los intervalos de igual amplitud A. 

R2. El numero de intervalos elegido, debe dar una distribucion de frecuencias mono 
modal , es decir, una distribucion cuyas frecuencias van aumentando 
progresivamente hasta una frecuencia maxima y luego van disminuyendo 
tambien progresivamente. 



Construction de la distribucion de frecuencias 

Dados n valores de alguna variable cuantitativa X continua (o discreta con mas 
de 20 valores distintos) uno de los metodos para construir la distribucion de 
frecuencias es: 

1. Determinar el rango ( R ) de variation de los datos que se define por 

^ = ^ max ~ X mm 

donde X fnax es el dato maximo y X es el dato minimo. 

2. Determinar el numero de intervalos, k , teniendo en cuenta la recomendacion Rl 



www.FreeLibros.me 



Distribution de frecuencios 



15 



Un valor aproximado del numero de intervalos, k , nos proporciona la regia 
de Sturges , donde, 

k= 1 +3.31og(n), /2>10, 

redondeado el numero al entero inmediato mayor. 

Por ejemplo, si se tienen n — 45 datos sin decimales, entonces, 
k ~ 1 + 3.31og(45) = 6.4556. Luego, k podra elegirse como 6, 7, 8, o cualquier 
otro numero entero, teniendo en cuenta las recomendaciones R1 y R2. 
Alternativamente se puede utilizar k — V/ 2, donde 25 < n < 400 . 

3. Determinar la amplitud A del intervalo, dividiendo el rango entre el numero de 

intervalos. Esto es, 

A = R/k . 

Si la division A — R/k no es exacta en el numero de decimales de los 
datos, entonces, el numero A se aproxima por exceso de manera que se cubra 
todo el rango, esto es. de manera que kA > R . 

Si los datos son enteros, A es entero, si los datos tienen un decimal, A tiene 
un decimal, etc. Por ejemplo, si los datos tienen dos decimales y si 
R/k =5.3416, se elige A = 5.35. (no 5.34). 

4. Determinar los extremos de los intervalos de la siguiente manera: 

',=[*. nin. S mn+ A[ 

1 2 = [^min + A, X mln + 2 A[ 
l 3 =[X mn+ 2A, X m)n + 3/l[ 

X ma +kA ] 

Observe que se cierra por la derecha el ultimo intervalo Esto se debe a que 
si la division R/k es exacta en el numero de decimales de los datos, entonces. 



EJEMPLO 1.3. 

Los ingresos quincenales en dolares (variable X) de 45 personas son: 



63 


89 


36 


49 


56 


64 


59 


35 


78 


43 


53 


70 


57 


62 


43 


68 


62 


26 


64 


72 


52 


51 


62 


60 


71 


61 


55 


59 


60 


67 


57 


67 


61 


67 


51 


81 


53 


64 


76 


44 


73 


56 


62 


63 


60 



Construir una distribucion de frecuencias de 8 intervalos. 
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SOLUCION: 



1) De los datos, se encuentra X ^ = 89 y X fTlin = 26 El rango de variacion de 
los datos es: R = 89 - 26 = 63 

2) La amplitud del intervalo se elige a partir del valor 



A 



* = « =7.875. 
k 8 



Como los datos son enteros, elegimos A — 8 . 

3) Los intervalos, el conteo y las frecuencias absolutas de los 45 ingresos 
quincenales se dan en el cuadro 1 .6: 



Cuadro 1.6. Distribution de los ingresos de 45 personas 



Intervalos 

h 


Conteo 


Frecuencias 


Absoluta 

f, 


Relativa 

h, 


Porcentaje 

Pi% 


[26,341 


/ 


1 


0.022 


2.2 


[34,421 


// 


2 


0.044 


4.4 


[42,501 


HU 


4 


0.089 


8.9 


[50,58[ 


mu mu 


10 


0.222 


22.2 


[58,66| 


minimum i 


16 


0.356 


35.6 


[66,74[ 


mu m 


8 


0.178 


17.8 


[74,821 


m 


3 


0.067 


6.7 


[82,90] 


/ 


1 


0.022 


2.2 


Total 




45 


1.000 


100.0 



NOTA. El paquete estadistico MCEST es una herramienta de trabajo muy util, 
entre otros paquetes para construir distribuciones de frecuencia El lector deberia 
verificar, por ejemplo, esta salida. 



Marca de clase 

Definition: La marca de clase o marca del intervalo I f = [L, M ,[ es el numero 
que se define como el punto medio del intervalo. Esto es. 
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Por ejemplo, las marcas de clase de los intervalos del cuadro 1.6 son 
respectivamente 30, 38, 46, 54, 62, 70, 78 y 86. 

La marca de clase es el numero que representa a todos los datos contenidos en 
el intervalo . Por ejemplo, el intervalo [58,66[ del cuadro 1.6 contiene 16 datos. 
ahora se deja sin efecto su valores reales y cada uno de ellos es representado por la 
marca del intervalo cuyo valor es 62. 

Es evidente pues, que al representar los datos tabulados en un intervalo por sus 
correspondientes marcas de clase, se dejan sin efecto los valores recopilados, por lo 
que se pierde alguna informacion. Por tanto, el calculo de las medidas descriptivas 
a partir de la distribucion de frecuencias da valores aproximados de los valores 
exactos. 



Grafica de la distribucion por intervalos 

La distribucion de frecuencias se representa graficamente por medio de un 
histograma , o de un poligono de frecuencias. A partir del poligono de frecuencias 
se puede trazar la curva de frecuencias. 

Histograma 

Es una grafica de barras rectangulares verticales juntas. La base de cada barra es 
proporcional a la amplitud del intervalo, y la altura es proporcional a su frecuencia 
(absoluta, o relativa, o porcentaje). 

En el eje horizontal se colocan las escalas de la variable. En el eje vertical se 
colocan las escalas de las frecuencias. 

Los numeros representativos de la escala de los intervalos son generalmente las 
marcas de clase de cada intervalo. Aunque tambien pueden colocarse los Iimites de 
los intervalos. 

La figura 1.4 es el histograma con frecuencias absolutas de la distribucion de 
frecuencias del cuadro 1.6. 

Poligono de frecuencias 

Es una grafica poligonal cerrada , que se obtiene uniendo con segmentos de 
recta, los puntos que tienen proporcionalmente como abscisa a la marca de clase 
y como ordenada a la frecuencia respectiva. Se cierra en ambos extremos en las 
marcas de clase adyacentes de frecuencia cero. 

La figura 1 .5 es el poligono de frecuencias del cuadro 1 .6. 
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Fig. 1.4. Histograma Fig. 1.5. Poligono 



Curva de frecuencias 

Una curva de frecuencias se obtiene del poligono de frecuencias "suavizando" 
sus puntos angulosos. En el proceso de suavizacion se recomienda tener en cuenta 
que la "portion" de area que se descarta debera ser proporcional a la "portion" de 
area que se incluye en el interior de la grafica. 

La figura 1.6 es la curva de frecuencias absolutas de la distribucion de 
frecuencias del cuadro 1.6. 

La curva de frecuencias es importante por que representa realmente el tipo de 
poblacion de la que se han obtenido los datos. 

La curva de frecuencias es tambien llamada modelo de la poblacion, y describe 
las caracterfsticas de la distribucion de la poblacion como: simetria. asimetrfa. tipos 
como: normal, bi modal, uniforme, etc.. 

Las curvas de frecuencias pueden pues tener una gran vanedad de formas. 
Algunas de ellas son las siguientes: 




Fig. 1.6. Curva de frecuencias 
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Distribuciones Simetricas 

Las curvas simetricas son de 3 tipos: 

Norma) o mesocurtica (figura 1.7(a)) 
Platicurtica (figura 1.7(b)), y 
Leptocurtica (figura 1.7(c)). 




Fig. 1.7 Curvas simetricas: (a) normal, (b) platicurtica, (c) leptocurtica 



Distribuciones Asimetricas 

Las curvas asimetricas pueden ser de dos tipos: 

Asimetricas positivas (o de cola al lado derecho), figura 1 8 (a). 
Asimetria negativa(o de cola a la izquierda), fig 1 .8(b) 




(a) 



Asimetrica positiva 
Fig. 



(b) Asimetrica negativa 
1.8 Curvas asimetricas 



Distribution multimodal 

Una curva de frecuencias es bimodal si tiene dos frecuencias maximas, como la 
figura 1.9(a). Es trimodal si tiene tres frecuencias maximas, como la figura 1.9(b). 

etc.. 
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(a) Curva bi modal 




(b) Curva tn modal 



Fig. 1.9 Curvas muldmodales 



1.4.4 Distribucion de frecuencias acumuladas 

A) Con variables cualitativas a nivel nominal no tienen ningun significado las 
frecuencias acumuladas. 

B) Si la variable es discreta y la distribucion de frecuencias es de la forma dato y 
frecuencia, entonces, las frecuencias (absolutas, relativas y porcentajes) se 
pueden acumular en la forma menor o igual que un valor determinado de la 
variable correspondiente a cada fila. 

Si la variable discreta X tiene valores distintos x x ,x^ x k con frecuencias 
absolutas respectivas /, , / 2 ^ entonces, la frecuencia absoluta acumulada, 

F t , del valor X i es la suma de las frecuencias absolutas de los valores menores o 
iguales a x } , esto es. 



*>£ Jr i = 

7=1 



La frecuencia relativa acumulada H t de x i f , se define por: 

F, 

n 



° H i=~’ i = 

7=1 



La frecuencia porcentaje acumulada P t de A- se define por 
P ( = //, x 100%, i = 
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Por ejemplo, en el cuadro 1.7, se muestran las frecuencias acumuladas del 
numero de hijos de 20 familias del cuadro l A Aqui, 

F 3 = Z /; =/.+/ 2 + / 3 = 1 + 4+7 = 12 . 

El valor 12 de F 3 significa que existen 12 familias que tienen 2 hijos o menos, 
o que el 60% de las familias tienen 2 hijos o menos. 



Cuadro 1.7. Distribution de frecuencias acumuladas del numero de 
hijos por famiha 



# de hijos 

x, 


Frecuencias 


Frecuencias Acumuladas 


Absoluta 

/, 


Relativa. 

h 


Porcent. 
Pi % 


Absoluta 

F, 


Relativa. 

H, 


Porcent. 

P s % 


0 


1 


0.05 


5 


1 


0.05 


5 


1 


4 


0.20 


20 


5 


0.25 


25 


2 


7 


0.35 


35 


12 


0.60 


60 


3 


6 


0.30 


30 


18 


0.90 


90 


4 


2 


0.10 


10 


20 


1.00 


100 


Total 


20 


1.0000 


100 









Grafica. 

La figuras 1.10(a) y L 10(b) representan la distribucion de frecuencias 
acumuladas absolutas y relativas respectivamente, "menor o igual que" del numero 
de hijos por familia del cuadro 1.7. 




0 12 3 4 X 

Fig. 1.10(a) 



1 * 


> 


0.9' 




0.8* 




0.7 ‘ 




0.6' 


- -Q 


0.5* 




0.4' 




0.3' 


p 


0.2' 




0.1 

— — < 


> 1 1 » 



0 1 2 3 4 X 

Fig. 1.10(b) 



Fig. 1.10. Grafica de frecuencias acumuladas de variable discreta 
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NOTA. (Funcion de distribution acumulada). Las graficas 1.10 son en realidad 
de una funcion denominada funcion^ de distribution acumulada (FDA) o 
simplemente funcion de distribution. Una definition mas rigurosa de esta funcion 
se hara mas adelante en el capftulo 6. 

Por ejemplo, la figura 1.1 0.b donde las frecuencias son relativas, corresponde, a 
la funcion de distribution acumulada que sigue: 



H(x) = 



0. 


si 


x<0 


0.05, 


si 


0<jc<1 


0.25, 


si 


1< x <2 


0.60, 


si 


2<x<3 


0.90, 


si 


3<x<4 


1.00, 


si 


x>4 



En general, si la variable discreta X tiene valores distintos jc, ,x 2 ,..^x k con 
frecuencias relativas respectivas h x , h k , entonces, su FDA menor o igual 
que x para todo jc real, se define por: 



0 , 



H{x) = 




1 . 



si x<x x 

si x t <x<x l+l , / = 1 , 2 ,...& 
si x>x k 



1 



C) Si la distribution de frecuencias es de intervalos, la frecuencia acumulada 
de cada intervalo es la suma de las frecuencias (absolutas, relativas o 
porcentajes) hasta ese intervalo. 

En el cuadro 1.8 se presentan las frecuencias acumuladas de los ingresos 
quincenales de 45 personas que corresponden al cuadro 1.6. 

En este cuadro, 

F 5 = 33 indica que 33 ingresos son menores que $66 



Grafica. 

La mas usada es el poligono de frecuencias acumuladas , conocida tambien 
como ojiva. La ojiva, se obtiene uniendo con segmentos de recta, los puntos cuya 
abscisa es proportional al limite superior U i de cada intervalo y cuya ordenada es 
proporcional a la frecuencia acumulada respectiva (absoluta, relativa o porcentaje). 
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Cuadro 1.8. Distribution de frecuencias acumuladas de ingresos 



Intervalos 

i, 


Frecuencias 


Frecuencias Acumuladas 


Absolut. 

f, 


Relativa. 

K 


Porcent. 

p,% 


Absolut. 

F, 


Relativa. 

", 


Porcenl. 

P i % 


[26,34[ 


1 


0.022 


2.2 


1 


0.022 


2.2 


[34,42[ 


2 


0.044 


4.4 


3 


0.066 


6.6 


[42,50[ 


4 


0.089 


8.9 


7 


0.155 


15.5 


[50.58[ 


10 


0.222 


22.2 


17 


0.377 


'ill 


[58.66[ 


16 


0.356 


35.6 


33 


0.733 


73.3 


[66,74[ 


8 


0.178 


17.8 


41 


0.911 


91.1 


[74,82[ 


3 


0.067 


6.7 


44 


0.978 


97.8 


[82,90] 


1 


0.022 


2.2 


45 


1.000 


100.0 


Total 


45 


1.000 


100.0 





La figura 1.11 representa la distribucion de frecuencias acumuladas de los 
ingresos quincenales de la muestra de 45 personas del cuadro 1 ,8. 



N#.persns. 




1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0 



Fig. 1.11. Ojiva de la distribution de los ingresos de 45 personas 



Aplicaciones de la Ojiva 



Con la ojiva se pueden resolver dos tipos de problemas 

1 ) Calcular el numero (o porcentaje) de observaciones que corresponden a un 
intervalo determinado de la variable. Por ejemplo, en la figura 1.11, 
aproximadamente 16 personas (33-17 en el eje vertical) tienen ingresos 
entre 58 y 66 dolares quincenales (en el eje horizontal). 
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2) Determinar cuantiles. 

Se denominan cuantiles a los valores de la variable que dividen a la 
distribucion de los datos en 2, 4, 10 o 100 partes iguales. 

Mediana. Es el valor Me de la variable que divide a la distribucion en dos 
partes iguales. 

Cuartil. Es cada uno de los tres valores , Q 1 , Q 3 que divide a la 
distribucion de los datos en 4 partes iguales. El cuartil (? 2 es a Me . 

Percentil (o centil). Es cada uno de los 99 valores 
P x P 2 /50 >•••* ^ 75 ’- ^99 que divide a la distribucion de los datos en 

100 partes iguales. El percentil P 25 =G,- ^o=e 2 y ^ 75 =^ 

NOTA. Un dato observado esta en el cuarto superior si es mayor que el tercer 
cuartil Esta en el cuarto inferior si es menor que el primer cuartil. 

EJEMPLO 1.4. 

En la distribucion de los ingresos quincenales de 45 personas, 

a) Determine el porcentaje aproximado de personas que tienen ingresos entre 
$52 y 75$. 

b) Calcular el valor de los ingresos que divide a la distribucion en dos paries 
iguales. 

c) Calcular el percentil 25. 

SOLUCION. 

a) De la distribucion de frecuencias se tiene que el porcentaje de ingresos 
quincenales comprendidos entre $52 y $75 es igual a: 

x + 35.6 + 17.8 + y 

donde x es el porcentaje comprendido entre $52 y $58, e y es el porcentaje 
comprendido entre $74 y $75. como se muestra en la figura que sigue. 

Frecuenc. % _ 22 \_ 17 8 _ 6 7 

Iniervalos ~ H 1 1 R \ — 

5052 58 66 74 75 82 

Los valores de x e y se calculan por interpolat ion lineal de la siguiente manera 
(Proviene de la semejanza de triangulos entre intervalos y frecuencias en la ojiva): 

jc 22.2 

= , de donde resulta x = 16.65 

58 - 52 58 - 50 



www.FreeLibros.me 



Distribution de frecuenaas 



25 



— = ^ de donde resulta v = 0.8375 
75 - 74 82 - 74 

Luego el porcentaje aproximado de personas que tienen ingresos entre $52 y 
75$ cs iguala: 16.65 + 35.6+ 17.8 + 0.8375=70.89. 

b) Mediante la ojiva se ubica el intervalo que contiene a Me (mediana) y que 
corresponde al 50% (o nf 2) de los datos. 

En ia distribution, nil = 22.5 . entonces, Mee [58, 66[ . 

Luego, Me = 58 + jr . donde el valor de x se calcula de la figura que sigue: 

17 22.5 33 

Free. Acumuladas 1 i 4 



Intervalos — 

_* 66-58 

22.5-17 “ 33-17 



ti. x \ 1 

58 Me 66 

de donde resulta x = -^-x8 = 2.75 
16 



Luego. el valor que divide a la distribution en dos partes iguales es: 
Me = 58 + 2.75 = 60.75$. 



c) Mediante la ojiva se ubiea el intervalo que tontiene a P 15 y que eorresponde al 

25% inferior (o 0.25f? ) de los datos. En la distribution, 0.25x« = 11.25 

entontes, P 2 $ e [50, 58[ . Ademas. P 25 =50 + x . el valor de x se caltuia de: 

x 58-50 ... . 4.25 _ . . 

, de donde resulta: x - — — x8 = 3.4 



11.25-7 17-7 ' 10 

Luego, el pertentil 25 es el niimero: P 25 =50 + 3.4 = 53.4 $. 



NOTA. El iettor deberia verificar que el valor del pertentil P k . (donde k es el 
pertentil k — 1,....25,...50 75 99) . ubitado en el intervalo /, es igual a: 

n(k/\00)~ 1 

f, J ’ 

donde: es el limite inferior del intervalo que tontiene a P k . 

fi es la fretuentia absoluta del intervalo que contiene a P k 
F t _ , es la fretuencia atumulada absoluta del intervalo / ( _, 

A es la amplitud del intervalo. 



p k - L i\ + 
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EJEMPLO 1.5 

Calcular los percentiles 10, 75. y 90 para los 45 ingresos quincenales tabulados 
en la distribucion de frecuencias del ejemplo 1.3 . 



SOLUCION. 



Pio ~ Lp K + 



n(l0/100)- Fj _ ! 

fi 



Pj5 — C?3 ~ Lp r + 



A = 42 + 

«(75/100)- F 



/, 



[ 



— A = 66 + 



42 + 3 = 45. 
33.75-33' 



x8 = 66.75. 



P90 ~ Lp. + 



n(90/100)- Fj_ 1 



f 



A = 66 + 



[m] 8 . 



66 + 7.5 = 73.5. 






(j^OTA. (Percentiles en datos no tabulados). Para n dates no tabulados (pero 
ordenados) , cl valor del percentil P k es: 

P k =(Xj +jr y+ 1 )/2 1 si g = 0, y P* = si g> 0 , 
donde: Q.k x n = 7 + £ , /: = rango percentil, 7 = parte entera . g = parte fraccional. 



EJEMPLO 1.6 

Determinar los cuartiles P 2 ^. P 5U . P 75 , para los siguientes dates 

1. 12. 4. 13, 8 , 9. 10. 2, 7 

SOLUCION 

AI ordenar los datos, resultan: 1. 2. 4. 7, 8 , 9, 10. 12, 13. 

Para P 2 5 . 0.25x/j=0.25x9=2. 25=2+0.25, entonces, 7 = 2 . g=0.25 

Luego, p 25 =* 7+1 =*3=4 

Para P ?0 , 0.50x/j=0.50x9=4.5=4+0.5. entonces. 7 = 4, g=0.5 

Luego. P50 = = ^5=8 

Para P 75 , 0.75 x/;=0. 75 *9=6.75=6+0,75, entonces, 7 = 6 * g=0.75. 

Luego, P 75 =_v /+l = * 7 =9 



EJEMPLO 1.7 

Los ingresos mensuales dc una muestra de n pequenos comerciantes se 
tabularon en una distribucion de frecuencias simettica de 5 interval os de igual 
amplitud resultando Ingreso minimo $125. marca de clase del cuarto inierxalu 
m 4 =$300. Si el 8 % de los ingresos son menores que $165 y el 70% de los 
ingresos son menores a $275. <que porcentaje de ingresos son supenores a $285?. 
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SOLUCION. 

Intervalos 



X mn =125, m 4 = 



^ S min + 3>4) + (A _ mjn +4 A) 



300, 



Luego. los intervalos son: 



entonces , A = 50 



[125, 175[ , [175, 225[ , [225,275[, [275,325[ , [325,375]. 



Frecuencias 

Si la distribucion de frecuencias es simetrica. entonces. /?, = h 5 . h 2 = h 4 . 
Si el 70% de los ingresos son menores que $275, entonces: 

/?, + h 2 + /?3 = 0.7 . 

De 2 h } + 2/i 2 + h y — 1 , se tiene h x + h 2 = 0.3 . Luego. h$ = 0.4. 



Ademas, si el 8% de los ingresos son menores que $165, entonces, - — = 



0.08 



de donde resulta h x =0.10. Finalmente h 2 =0.2. 

Luego. las frecuencias relativas son: 0.1, 0.2, 0.4, 0.2, 0.1. 



Los ingresos superiores a $285 son: — (0^ .2) + 0.1= 0.26 



o 26%. 



1.5 Otras graficas estadisticas 

En aigunos casos. el total en cada modalidad de una variable, puede estar 
compuesto de varias partes, como por ejemplo. en el cuadro 1.9 la modalidad "ano" 
tiene las componentes "hombres". ’’mujeres''. y "total". El tipo de grafico para este 
cuadro depende de lo que sc quicre resaltar, 

Cuadro 1.9. Poblacion (cn miles) de una ciudad de 1975 a 1990 



Ano 


Hombres 


Mujeres 


Total 


1975 


8 


17 


25 


1980 


12 


20 


32 


1985 


10 


30 


40 


1990 


18 


27 


45 



Grafica de Lmea 

Si se quicre resaltar variacioncs de los datos a traves del tiempo, se utiliza una 
grafica de Imeas, la misma que se obtiene uniendo con segmentos. puntos de la 
forma: (tiempo, frecuencias) en cada modalidad y para una o mas de las partes 
componentes. Por ejemplo, la figura 1.12 representa la poblacion total del cuadro 
1.9 desde 1975 a 1990. 
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Esiadisnca 




Fig. 1.12. Poblaci6n total de 1975 a 1990 



Grafica de barras agrupadas 

Si se trata de comparar solamente las componentes o las frecuencias en cada 
modalidad, se puede utilizar un grafico de barras agrupadas. En cada modal idad se 
trazan tantas barras adjuntas como componentes hay. Por ejemplo. la figura 1.13 
representa las frecuencias de cada componente en cada modalidad del cuadro 1 .9 




□ Hombre^ 
CMujeres 



Fig. 1.13. Poblacion de una ciudad de 1975 a 1990 



Grafica de barras componentes 

a) Si se quiere resaltar a la vez el total y las frecuencias de cada componente en 
cada modalidad, entonces, conviene utilizar un grafico de barras componentes 
como el de la figura 1.14. En cada modalidad se traza una barra cuyo largo es 
proporcional al total de sus datos. La grafica 1.14 de barras componentes del 
cuadro 1 .9 resume la variacion de la poblacion de una ciudad desde 1975 hasta 
1990, resaltando ei total y los parciales en cada modalidad. 
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50 j 

40 ■■ 

30 ■■ 

20 •- 

io - ; — — 

o i l - - -LI — J— * — L-l — 

1975 1980 1985 1990 

Fig. 1.14. Poblacion de una ciudad de 1975 a 1990 



□ Mujeres 

□ Hombres 



b) Si se trata de destacar la importancia relativa de sus componentes, se puede 
utilizar un grafico, como la flgura 1.15, donde todas las barras son de iguai 
longitud y equivalentes al 100% en cada categorfa. 

El cuadro 1. 10, tiene los mismos datos del cuadro 1.9, solo que ahora se 
eonsideran los porcentajes o valores relativos, en vez de los valores absolutos. 

Cuadro 1.10. Poblacion (en %) de una ciudad de 1975 a 1990 



Ano 


Hombres 


Mujeres 


Total 


1975 


32.0 


68.0 


100 


1980 


37.5 


62.5 


100 


1985 


25.0 


75.0 


100 


1990 


40.0 


60.0 


100 



La proporcion de cada componente respecto al total en cada categorfa. se 
representa en la figura 1.15. 



100%r 

90%- 
80%. 
70%. 
60%. 
50%. 
40%. 
30%- 
20 % ■ 
10 %. 
0 %.- 



□ Mujeres 

□ Hombres 



1975 1980 1985 1990 

Fig. 1.15. Poblacion de una ciudad de 1975 a 1990 en porcentajes 
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Cuando se utilizan figuras de igual tamano para reflejar la caracteristica que se 
quiere representar, al grafico estadistico, se denomina pictografia. En una 
pictografia el numero de figuras en cada categoria o modalidad es proporcional a la 
frecuencia absoluta respectiva. 

Existe otra gran variedad de graficas o diagramas para mostrar datos 6 para 
mostrar relaciones entre varios grupos de datos. Aqui la imagination del dibujante 
juega un papel muy importante. 



EJERCICIOS 



Variables y Escalas 

1. Cierta variable asigna a las unidades estadisticas E l y E 2 de una poblacion los 
valores 5 y 20 respectivamente en una escala dada. ^Que puede decir acerca 
de E, y E 2 si la escala usada es: 

a) nominal?, b) ordinal?, c) de razon?. 

Rp. a) E, * E-, , b) E, < E-, , c) 20/5=4. la medida de E 2 es igual a 4 veces a la de E, 

2 . Cierta variable asigna los valores 1 , 4 y 9 a las unidades estadisticas E|, E 2 , E 3 

respectivamente en una escala de intervalos. Si en la misma escala se asigna 1 a 
Ej y -8 a E 2 , valor se le asigna a E 3 ?. Rp. -23. 

3 . Al medir cierta caracteristica en una poblacion a las unidades estadisticas E, , 

E 2 y E 3 se les asigna los valores 2 , 5 y 17 respectivamente usando una escala 
A. En cambio, usando una escala B, se asignan los valores 5 y 29 a E 2 y E 3 
respectivamente. 

a) ^Podria afirmarse que A y B son la misma escala de razon? 

cQ u e podria afirmar sobre el valor de E, usando la escala B, si se sabe que 

ambas escalas son nominales? , son ordinales?, son la misma de intervalo?. 

Rp. a) No, 17/5*29/5. b) Norrunal: cualquiera, *5 y *29, ordinal: <5, intervalo: -1. 



www.FreeLibros.me 



Distribution de frecuencias 



31 



4. Sean jc, = -l, x 2 = 0, jc 3 = 1 . mediciones de una variable X a tres eiementos de 

una poblacion en una determinada escala. Suponga que son validas las 
transformaciones: 

i) Y = 2X-5, ii) Y = X 2 + 3 

a) Si la escala es nominal, ^estan las mediciones transformadas tambien en 
escala nominal? 

b) Si la escala es ordinal, *estan las mediciones transformadas tambien en 
escala ordinal? 

c) Si la escala es de intervalos, *,estan las mediciones transformadas en la 
misma escala de intervalos? 

Rp. a) i) Si, ii) No, b) i) Si, ii) No, c) i) Si, ii) No 

5. Sean JC| =0 e y l =32 dos valores asignados al mismo elemento para medir la 

temperatura, y, x 2 = 100 e y 2 = 212 dos valores asignados a la temperatura de 
otro elemento. Si los valores X (grados centfgrados o Celsius) e Y (grados 
Fahrenheit) estan en escala de intervalos, hallar la relacion entre X e Y 

Y = aX+b Rp. a= 9/5, b=32. 

6. Al medir cierta caracteristica en una poblacion, las escalas A y B asignan valores 

x e v a un mismo elemento. Si la relacion entre los valores es 




c Son ambas escalas Ay B, a) de intervalos?. b) de razon?. 

Rp. a) Si A es de intervalos, B lo es tambien. b) Si A es de razon. B no lo es. 



7. Clasifique las variables e indique el tipo de escala en que estan medidas las 
siguientes caracteristicas 

- Profesion - Afio de nacimiento 

- Nacionalidad - Edad 

- Grado de instruccion - Estado civil 

- Numero de hijos - Ingreso mensual familiar promedio 

- Numero de telefono - Numero de DNI 

- Direccion 



Distribuciones de frecuencias 

8. Al investigar el nivel socioeconomico en los valores: Bajo(B), medio (M), 
alto(A), 20 familias dieron las siguientes respuestas: 

M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B. 

Construir la distribucion de frecuencias y trazar su grafica. 
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9. Se revisaron 20 lotes de 48 articulos cada uno y se encontro el siguiente numero 

de articulos defectuosos por lote: 

3, 2, 5,0, 1,3,2, 1,0, 1,3, 4, 2. 4. 4. 3, 4, 3. 2, 3. 

Construir la distribucion de frecuencias relativas y frecuencias relativas 
acumuladas. Graficar. ^Que porcentaje de lotes tienen dos o mas pero menos dc 
4 articulos defectuosos?. Rp.50%. 

10 . Determinar los intervalos de la distribucion de frecuencias en cada uno de los 
siguientes casos: 

a) Datos enteros, X ^ = 10, X max = 50, y k = 8 intervalos. 

b) Datos con dos decimales, X ^ =2.55, X max = 3.86, y k-1 . 

c) Datos con tres decimales, X ^ =0.282, X max = 0.655, y k = 6. 

Rp. a) A= 5. b) A=0. 19. c) 0.063 



11 . La inversion anual, en miles de dolares, de una muestra de 40 pequenas 
empresas fueron: 



31 


17 


27 


20 


28 


10 


34 


25 


4 


24 


15 


39 


18 


30 


41 


26 


12 


46 


18 


23 


36 


19 


29 


37 


33 


27 


27 


24 


26 


31 


25 


28 


33 


28 


22 


23 


31 


29 


35 


21 



a) Construir una distribucion de frecuencias de 7 intervalos de clase. 

b) Determinar el porcentaje de empresas con una inversion entre 14 mil y 20 

mil dolares. Rp. a) A = 6. Frecuencias: 1 . 3, 6, 1 2, 1 1 . 5. 2. b) ! 2.5%. 



12 . Se registra el tiempo en minutos que utilizan 30 alumnos para ejecutar una 
tarea. resultando los siguientes: 

21.3 15.8 18.4 22.7 19 6 15 8 26.4 17.3 11.2 23.9 

26.8 22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2 

08.3 21.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1 

a) Construir una distribucion de frecuencias de 6 intervalos de igual amplitud y 

a partir de esta 

b) Calcular el tiempo debajo del cual se encuentran el 25% de las tareas. 

Rp. A = 3.1, frecuencias: 3, 4. 5. 8. 6. 4. b) 14.81 

13 . Las notas del examen parcial de matematica dieron la siguiente distribucion de 
frecuencias 

a) Completar la distribucion de frecuencias. 

b) Graficar la ojiva de porcentajes. 
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c) iQue porcentaje de las notas se encuentran aproximadamente en el 
intervalo:(8. 14]. 



Intervalo 


Marca de clase 


Frecuencia 

Relativa 


Free, relativa 
acumulada 


i . [ 




0.15 




[6 , t 






0.45 


[ . [ 






0.70 


[ , [ 


13.5 






[ . 1 




0.10 





Rp. a) Xmm=3, A=3, free.: 0 15. 0.30, 0.25. 0.20. 0.10, c) 48.3%. 



14. La distribucion de los tiempos, en minutos, que utilizaron 65 personas para 
realizar una prueba de aptitud aparece representada en el siguiente histograma. 
t,Que porcentaje de las personas emplearon entre 9 y 1 1 .5 minutos ?. 

Rp. ( 1 5+20+6.5)765=0.6385 . 




15. En una compafna, el sueldo minimo y maximo de 200 empleados es de $150 y 

$300 respectivamenie. Tales sueldos se tabulan en una distribucion de 
frecuencias de 5 intervalos de igual amplitud. Si se sabe que 20 empleados 
ganan al menos 150$, pero menos de $180, 60 ganan menos de 210$, 110 

ganan menos de $240, 180 ganan men os de $270 y el 10% restante de 
empleados gana a lo mas $ 300; reconstruir la distribucion y graficar su 
polfgono de frecuencias. 

Rp. X min =150. ,4=30. free. absolutas:20, 40, 50, 70. 20 

16. La demanda diaria de azucar (en decenas de kilos) recopilada durante ciento 
noventa dfas en un supermercado, se tabulo en una distribucion de frecuencias 
simetnea de cinco intervalos de amplitud iguales a 4. Si la marca de clase del 
intervalo central es igual a 12 y si la curva de frecuencias absolutas satisface la 
relacion: 
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f(x) = -(x- 12) 2 +70 

reconstruir la distribucion y graficar su histograma. 

Rp. ^ min =2, free, absolutas: 6, 54, 70, 54, 6. 



17 . Los tiempos de vida util (en dias) de un tipo de baterfa, se tabulo en una 
distribucion de frecuencias de 5 intervalos de igual amplitud con frecuencias 
relativas acumuladas: 0.10, 0.25, 0.55, 0.80, 1.00. Determine la distribucion de 
frecuencias absolutas si la tercera ffecuencia absoluta acumulada es 11, si la 
segunda marca de clase es 6, y si el limite inferior del cuarto intervalo es 12. 

Rp. *mir>=0 ? A= 4, n=20, frecuencias. 2, 3, 6. 5,4 



18 . Los ingresos mensuales de una muestra de pequenos comerciantes se tabularon 
en una distribucion de frecuencias simetrica de 5 intervalos de igual amplitud 
resultando: Ingreso minimo $125, marca de clase del cuarto intervalo 
m 4 =$300. Si el 8% de los ingresos son menores que $165 y el 70% de Ios 

ingresos son menores a $275, ^que porcentaje de ingresos son superiores a 
$2857. 

Rp. >4=50, frecuencias 0.1, 0.2, 0.4, 0.2, 0.1, % de casos supenores a $285 es =0 26. 

19 . La organization del tiempo, en minutos, que tardaron 100 obreros para ejecutar 
cierta tarea, ha dado una tabla de frecuencias de cuatro intervalos de igual 
amplitud cuyo histograma correspondiente es simetrico. Si el intervalo 
I x = [6, ?] , la frecuencia absoluta: f 2 = 2f x + 5 , y si se sabe que el 85% de 

los obreros demoran menos de 12 minutos. Completar la distribucion de 
frecuencias. 

Rp. X m .„=6, A= 2, free, relativas: 0.15, 0.35, 0.35. 0 15. 

20 . Los puntajes de una prueba de aptitud se tabularon en una distribucion de 

frecuencias de 6 intervalos de igual amplitud. Si se tienen: marcas de clase, 
^2 - 40 y m 4 = 80 , frecuencias: h x =h^, h 3 = h 4 = 0 . 25 , lh~ h 4 - 

~ \ + 0 - 10 , y — 60 , completar la distribucion de frecuencias absolutas y 
graficar el poligono. 

Rp- X min =10, >4=20, frecuencias: 6, 9, 12, 15, 12, 6 



21 . Las notas de un examen se tabularon en una distribucion de frecuencias 
relativas de 3 intervalos de amplitud iguales a 5. Si la nota minima es igual a 5. 
el 48% de las notas son menores que 12, y si el 80% de las notas son infenores a 
16, reconstruir la distribucion de frecuencias. 

Rp frecuencias 0.30, 0.45, y 0.25 



www.FreeLibros.me 



Distribution de frecuencias 



35 



22. El tiempo (en horas j de 120 familias que utilizan su computadora se tabularon 

en una distribucion de frecuencias de 5 intervalos de amplitud iguales a 4, 
siendo; el tiempo mini mo de uso 2 horas, la primera y segunda frecuencias 
iguales al 10% y 15% del total de casos respectivamente. Si el 73.75% de las 
familias lo usaron menos de 17 horas y el 85% menos de 19 horas, determine 
las frecuencias. Rp. 0.10, 0.15, 0.30, 0.25, 0.20 o 12, 18, 36, 30, 24 

23. Los salarios que ofrece una empresa a tos practicantes varian entre $150 y 
270$. Si los salarios se agrupan en cuatro intervalos de clase de longitudes 
iguales de manera que el 40% de los practicantes tienen salarios menores o 
iguales que $195, el 80% tienen salarios menores o iguales que $225 y el 15% 
tiene salarios mayores que $232.50. 

a) Hallar el porcentaje de practicantes en cada intervalo. 

b) Si el ingreso minimo se fija en $240 y la empresa aumenta una misma 
cantidad a todos los practicantes de modo que el 20% supere el ingreso 
minimo. ^cuanto seria el aumento?. 

Rp. a) frecuencias: 0.10, 0.60, 0.20, 0.10, b) $15. 

24. El consumo mensual de agua de 150 hogares, se tabularon en una distribucion 

de frecuencias simetrica de 6 intervalos, siendo las frecuencias: =25, 

F 3 =75, F * = 130. Si el lfrnite inferior del sexto intervalo igual a 60, y si el 
75% de los consumos son mayores de 43.5m 3 , completar la distribucion de 
frecuencias. Rp. X min =35, /\=5, frecuencias: 20. 25, 30, 30, 25. 20. 

Otras Graficas 

25. La siguiente tabla muestra la superficie (en millones de millas cuadradas) de los 
oceanos. 

Oceano Pacifico Atlantico Indico Antartico Artico 
Superficie: 70 41 28 7 4 

Identiricar la variable, y represente los datos mediante dos graficos diferentes. 

Rp.grafica: barras y circular 

26. Construva una grafiea adecuada que permita comparar la predileccion de los 
estudiantes por las earreras dc ciencias en tres universidades si se tienen los 
siguientes datos. 



Universidades 


Alumnos que 
prefieren ciencias 


Total de alumnos 


A 


300 


6000 


B 


200 


4000 


C 


180 


7200 



Rp graficar las free Relatives 300/6000=0.05. 200/4000=0.05, 180/7200=0.025 
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27. Se ha clasificado a un grupo de personas de acuerdo a su ocupacion y 
procedencia. La distribucion resulto la siguiente. 





Costa 


Sierra 


Selva 


Agncultores 


15 


16 


7 


Mineros 


5 


9 


4 


Tecnicos 


13 


8 


2 


Obreros 


16 


11 


4 



a) Haga un grafico para representar la distribucion de las personas por su 
ocupacion. 

b) Haga un grafico para comparar la region de procedencia de las personas 
segun su ocupacion. 

Rp. grafica a) barras totales, b) barras agrupadas 



28. El volumen de exportation de cobre, en miles de toneladas, durante el perfodo 
95-99 se dan en la tabla que sigue. Trazar un grafico para 



Ano 


Gran mineria 


Mediana mineria 


Pequeiia mineria 


1995 


30 


30 


30 


1996 


50 


50 


30 


1997 


80 


60 


43 


1998 


60 


40 


42 


1999 


50 


45 


40 



a) Mostrar la evolution de las exportaciones. 

b) Ver el tipo de mineria que determina principalmente la tendencia de las 
exportaciones. 

c) Mostrar la proportion de cada tipo de mineria respecto al total de 
exportaciones por ano. 

Rp. c) barras por partes components. 
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DIAGRAMA DE TALLO (oTRONCO) YHOJAS 

Es una tecnica que se usa para organizar datos sin perder la identidad de cada 
dato observado, como sf ocurre en una distribution de frecuencias por intervalos. 

El diagrama de tallo y hojas se construye partiendo cada dato numerico en dos. 
El tallo que consiste del dfgito o los dfgitos iniciales y las hojas que consisten de 
los dfgitos restantes del dato. Usualmente se eligen entre 5 y 20 tallos 

Los tallos ordenados son ubicados en forma vertical. Las hojas ordenadas de 
cada tallo son ubicadas horizontal mente. 

EJEMPLO 

Con los siguientes datos (ingresos quincenales en dolares del ejemplo 1.3): 



63 


89 


36 


49 


56 


64 


59 


35 


78 


43 


53 


70 


57 


62 


43 


68 


62 


26 


64 


72 


52 


51 


62 


60 


71 


61 


55 


59 


60 


67 


57 


67 


61 


67 


51 


81 


53 


64 


76 


44 


73 


56 


62 


63 


60 



a) Desarrolle un diagrama de tallo y hojas. 

b) Halle el porcentaje de ingresos quincenales inferiores a $52 

c) <Cual es el valor de en medio o central? 

d) ^Cuantos valores estan entre 50 y 65? 

SOLUCION. 

a) Utilicemos el primer dfgito de cada dato como tallo y el segundo como hoja. 
Para el numero 63 por ejemplo, el tallo es 6 y la hoja es 3. Como el dato mfnimo 
es 26 y el dato maximo es 89, entonces los tallos empiezan en 2 y terminan en 8. 
Despues de organizar todos los datos, el diagrama de tallo y hojas resulta: 



Tallo 


Hojas 


2 


6 


3 


56 


4 


3349 


5 


112335667799 


6 


000112222334447778 


7 


012368 


8 


19 



b) El porcentaje de ingresos quincenales inferiores a $52 es (9/45)=0.2 o 20%. 

c) El valor de en medio o central es: $61 

d) Hay 26 valores entre 50 y 65 
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EJEMPLO 

Los siguientes datos representan el periodo de duration en meses de 32 baterfas 
“DURA” doble A: 



3.3 


4.0 


6.0 


4.2 


6.0 


5.4 


4.5 


1.5 


7.0 


6.5 


7.4 


5.2 


5.7 


6.2 


5.5 


5.2 


6.8 


3.8 


24 


3.6 




5.0 


6.2 


5.3 


6.5 


5.5 


6.0 




2.8 


7.1 


6.7 


4.7 


5.6 


5.9 





a) Desarrolle un diagrama de tallo y hojas. 

b) <Cual es el valor de en medio? 

c) ^Cuantas baterlas duraron entre2.9y5.8 meses? 

SOLUCION. 

a) Utilicemos digito entero de cada dato como tallo y el dfgito decimal como hoja. 
Para el numero 5.2 por ejemplo, el tallo es 5 y la hoja es 2. Como el dato 
minimo es 1.5 y el dato maximo es 7.4, entonces los tallos empiezan en 1 y 
terminan en 7. 

Despues de organizar todos datos, el diagrama de tallo y hojas resulta: 



Tallo 


Hojas 


1 


5 


2 


48 


3 


368 


4 


0257 


5 


0223455679 


6 


000225578 


7 


014 



b) El valor de en medio es: 5.5 meses 

c) Hay 16 baterias que duraron entre 2.9 y 5.8 meses. 

EJEMPLO 

El siguiente es el diagrama de tallo y hojas de los valores (un entero y dos 
decimales) de una variable continua. El tronco consiste de un entero y un decimal: 



Tallo 


Hojas 


35 


245 


36 


3567 


37 


34556889 


38 


0024455 


39 


358 



a) ^Cuantos datos se observaron?. Indique el minimo y el maximo. 

b) iCuA\ es el valor del centro? 

Rp. a) 25 datos, Min = 3.53, Max = 3.98, b) 3.78 
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2.1 Introduccion 

Los datos orgamzados en una distribucion de frecuencias destacan sus 
caracteristicas mas esenciales, como marcas de clases, centro, forma de 
distribucion (asimetrica, simetrica,) etc.. Sin embargo, los indicadores que 
describen a los datos en forma mas precisa, deben caicuiarse. Estos indicadores 
resumen los datos en medidas descriptivas que se refieren a la centralization o 
posicion, a la dispersion o variation, a la asimetria, y a la curtosis de los datos. 

Las medidas de posicion reflejan la tendencia centra! y la localization de los 
datos. 

Las medidas de tendencia central, denominados tambien promedios, ubican el 
centro de los datos, como la media aritmetica , la media geometrica. la media 
armonica y la mediana. 

Las medidas de localizacion indican el lugar de los datos mas frecuentes 
(moda ) o de los me nos frecuentes a partir de los cuannles, 

El lector deberfa correr paquetes de computo emre otros el MCEST para las 
aplicaciones de este capitulo. 

2.2 Mediana 

Defmicion. La mediana o valor mediano de una sene de valores observados es el 
numero M e que separa a la sene de datos ordenados en forma creciente (o 

decreciente) en dos partes de igual numero de datos. 

La mediana es la medida promedio que depende del numero de datos ordenados y 
no de los valores de estos datos. 
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2.2.1 Calculo de la mediana 

1) Mediana de datos no tabulados 

Se sigue el metodo de percentiles de la pagina 26. Esto es, para determinar la 
mediana de n valores no tabulados de una variable cuantitativa X : 

1 ) Se ordenan los datos en forma creciente. 

2) Luego, se ubica el valor central Me . Si n es impar, la mediana es el dato 
ordenado del centro Pero si n es par, la mediana es la semisuma de los dos 
valores ordenados centrales. 

EJEMPLO 2.1 

Calcular la mediana para las siguientes series de datos. 

a) 120. 3, 14. 1, 99. 7, 30, 2,000, 16 

b) 30. 77, 3, 300, 36, 11, 10,000, 29 

SOLUCION 

a) La serie ordenada de los 9 datos es : 

1, 3. 7. 14, 16, 30, 99. 120, 2.000. 

La mediana es el quinto dato ordenado que divide a la serie en 2 grupos de 4 
datos cada uno. Esto es. Me = 16. 

b) La serie ordenada de los 8 datos es: 

3, 11. 29, 30, 36, 77, 300. 10,000. 

la mediana en estc caso, puede ser cualquier numero situado entre 30 y 36. ya 
que este dividira a los datos en dos grupos de 4 datos cada uno. Pero. para evitar 
la infinidad de valores. se elige como mediana la semisuma de los do< valores 
centrales. Esto es. Me - (30 + 36)/ 2 = 33 . 

Observar pues. que la mediana no deplete de la magmtud de los datos. Depende 
solo del numero de ellos. 

NOTA. El lector puede verificar que la mediana de los 45 ingresos quincenales sin 
tabular por intervalos del ejemplo 1.3, es igual a 61 dolares. 

2) Mediana de datos tabulados 

2a) Si los valores de una variable discreta se tabulan en una distribution de 
frecuencias de la forma "dato ffecuencia", el c&lculo de la mediana se hace 
siguiendo el procedimiento anterior 1) debido a que los datos estin ordenados. 
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Por ejemplo, la mediana para la distribution del numero de hijos por familia del 
ejemplo 1 .2 es igual a 2. 

2b) Si los valores de la variable se tabulan en una distribution de frecuencias por 
intervalos, la mediana se determina aproximadamente por interpolacion a 
partir de la distribucion de frecuencias acumuladas, metodo ya propuesto en 
aplicaciones de la ojiva.(capitulol) 

Para calcular la mediana: 

Primero se determina el intervalo / 4 = \ L iy U l [ que contiene a la mediana Me , 
Para esto, se determinan las frecuencias acumulada F i y F-_, de manera que: 
(ver figura 2.1) 

/V, <n/2<F r 

A partir de n/2 en el eje vertical, se traza una paralela a la ojiva, y de la ojiva se 
traza una vertical al eje de los intervalos. 

La mediana Me € [L ( , £/ ( [ , intervalo de amplitud A, cuya frecuencia 
absoluta acumulada es fj, y la no acumulada es f t — F i — fj_|. 

Segundo, la mediana Me e [L - , U - [ . Luego, 



Me = L i + a 

donde a se obtiene por interpolacion (semejanzas de triangulos ABE y ACD de 
la figura 2.1) comparando intervalos con frecuencias: 



a 

A 




de donde a 




f, 



A, 



Luego, 



Me = L t + 




A 



Donde: 

L i es el limite inferior del intervalo de la mediana. 
n es el numero de datos observados. 

F t _ j es la frecuencia acumulada absoluta del intervalo inmediatamente 
anterior al intervalo de la mediana. 
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fi es la frecuencia absoluta del intervalo de la mediana. 
A es la amplitud del intervalo de la mediana. 




EJEMPLO 2.2 

Calcular la mediana para la muestra de los 45 ingresos quincenales tabulados 
del ejemplo 1.3 

SOLUCION 

Los datos tabulados del ejemplo L3 se repiten en el cuadro 2.L donde n- 45. 
n!2=22.5. 



Cuadro 2.1. Calculo de la mediana 



Ingresos 

/, 


Numero de personas 

fi 


Free, acumuladas 

F, 


[26,34[ 


1 


1 


[34,42[ 


2 


3 


[42.50[ 


4 


7 


[50,58[ 


10 


17 


[58,66[ 


16 


33 


[66,74[ 


8 


41 


[74,82[ 


3 


44 


[82,90] 


1 


45 


Total 


45 
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El valor 22.5 esta entre las frecuencias acumulada 17 y 33, luego, la mediana. 
Me e [58,66[. 

Adeinas L, = 58, F,_, =17. f i = 16, A = 8, 

Luego, 

--F 

o F 22 5 — 1 7 

Me = L, + ± A = 58 + — x 8 = 58 + 2.75 = 60.75. 

ft 16 J 



NOTA (Calculo de la mediana para frecuencias relativas) 

Si en lugar de las frecuencias absolutas se utilizan las frecuencias relativas (o 
porcentajes), entonces, haciendo h i — f t / n , = F k _ x / n en ia formula de la 

mediana, se tiene: 



Me=L.+ 



/V2 -^A=5 8 / V2 -' 7 / 45 ' 









1^45 



x8 = 60.75 



2.2.3 Propiedades de la mediana 

1) La mediana, solo depende del numero de datos ordenados y no del valor de los 
datos Per lo tanto, no es sesgada por algun valor grande o pequeno. 

2) La mediana puede ser calculada para distribuciones de frecuencia con 
intervalos de diferente amplitud, siempre que se pueda determinar el lfmite 
inferior del intervalo de la mediana, l^. 

3) La mediana puede ser calculada para variables con valores en escala ordinal. 

4) La suma de las diferencias (en valor absoluto) de n datos con respecto a su 
mediana es minima. En el caso de datos sin tabular, 

n 

^ jc f — c] = minimo, si c es la mediana de los x i . 

i=l 



EJEMPLO 2.3 

Cinco personas que viven en lugares situados a distancias en kilometros a lo 
largo de una carretera en linea recta como se indica en la figura que sigue, deben 
reunirse en algun punto de la carretera. Determine el lugar de reunion de manera 
que el costo total del transporte sea minimo, si el costo de cada transporte es 
proporcional al recorrido. 
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Distancias, 20 



15 , 6 . 10 



Lugares A 



B 



C D 



E 



SOLUCION 

Sea A el origen, entonces, las coordenadas de A, B, C, D y E son 
respectivamente: x } = 0, x 2 = 20, jc 3 = 35 , x 4 = 41 y jc 5 =51 . 

Sea K el lugar de reunion. Dado que el costo es proporcional al recorrido, el 
costo total del transporte es: 



Este costo total es minimo, si K es la mediana de los 5 valores 0, 20, 35, 41,51, 
esto es si K = 35 . Luego, deben reunirse en el lugar C a 35 kilometros de A. 



Definition. La moda de una serie de datos es el valor Mo , que se define como 
el dato que mas veces se repite. 

La moda no siempre existe y si existe, no siempre es unica. 

En matematica, la moda es el valor de la variable en el que existe un maxi mo 
absoluto (o dos o mas maximos relativos iguales). 

La moda es una medida promedio que se usa cuando se quiere serial ar el valor 
mas comun de una serie de datos. Por ejemplo, los comerciantes se estoquean con 
productos que estan de moda. 

La moda es el promedio me nos importante debido a su ambigiiedad. 

EJEMPLO 2.4 

La moda de los datos: 

a) 7, 9, 7, 8, 7, 4, 7, 13, 7 es igual a 7. Esta sene de datos es unimodal 

b) 5, 3, 4, 5, 7, 3, 5, 6, 3 es igual tanto a 3, como a 5. Esta serie de datos es 
bimodal. 

c) 31, 1 1, 12, 19 no existe. (Tambien vale decir que cada uno de los datos es 
una moda). 

NOTA. La moda de los 45 ingresos quincenales sin tabular del ejemplo 1.3. es 
igual a 62 dolares (verificar!). 



5 




i=l 



2.3 Moda 
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Moda de datos tabulados por intervalos 

Para calcular la moda de n datos tabulados por intervalos, primero se determinu 
el intervalo que contiene a la moda, esto es, el intervalo que tiene la mayor 
frecuencia (interwlo modal). Luego se utili^a la formula 



Mo = L ; + 



d x ' 

+ d 2 j 



A . 



donde; 



L x es el lfmite inferior del intervalo modal. 

d x = f i — / ( _j , esto es, d x es igual a la frecuencia del intervalo modal 
menos la frecuencia del intervalo inmediatamente anterior. 
d 2 = f x — f i+ i , esto es, d 2 es igual a la frecuencia del intervalo modal 
menos la frecuencia del intervalo inmediatamente posterior. 

A es la amplitud del intervalo modal. 



NOTA. La formula de la moda solo se aplica en distribuciones con una sola 
frecuencia maxima. 



EJEMPLO 2.5 

Calcular la moda de los 45 ingresos quincenales del ejemplo 1.3 tabulados por 
intervalos. 



SOLUCION. 



Los datos tabulados por intervalos del ejemplo 1.3 se repiten en el cuadro 2.1. 
Aquf se observa que Mo e[58,66[. Ademas, 

L i =5 8, ^=16-10 = 6,^=16-8 = 8, A = 8. 

Luego, la moda de la distribucion es: 



/ 



Mo = L. + 



J, +d 



A = 58 + 



2 J 



- 6 1x8= 

! + 8j 



61.43. 



NOTA: (Calculo de la moda con frecuencias relativas) 

Si en lugar de las frecuencias absolutas se utilizan las frecuencias relativas, se 
tiene: 



Mo = L i 



d t ' 



+d 2 



A = 58 + 



' 6/45 ) 

,(6 + 8)/45j 



x 8 = 61 .43. 
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2.4 Media aritmetica 

Definition. La media aritmetica , denominada simplemente media, es la suma de 
los valores observados de la variable, dividido por el numero de observaciones. 

Para valores de una variable X observados en una muestra , la media aritmetica 
se denota por x . 



2.4.1 Calculo de la media aritmetica 

1) Media aritmetica de datos no tabulados 

La media de n valores , de la variable cuantitativa X, observados 

en una muestra es el numero: 



n 




n 



EJEMPLO 2.6 

Utilizando los datos sin tabular del ejemplo 1 .3 calcular la media aritmetica 

SOLUCION 



La suma de los 45 ingresos sin tabular es $2682. Luego, 



45 




45 



$2682 

45 



$59.6 



2) Media aritmetica de datos tabulados 

2a) Media para datos tabulados de variable discreta 

Si n valores de una variable estadistica discreta X se clasifican en k valores 
distintos x x , x 2 j..-,x k con frecuencias absolutas respectivas , / 2 ,..., / A . , 
entonces, su media aritmetica es el numero: 

i>, 

x= -*=* 

n 
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EJEMPLO 2.7 

Calcular la media aritmetica de la distribucion del numero de hijos por familia 
del ejemplo 1 .2. 

SOLUCION 

La distribucion de frecuencias del ejemplo 1 .2 se repite en el cuadro 2.2,donde 
sc ha incluido una columna de productos f t x t 



Cuadro 2-2. Calculo de la media del numero de hijos por familia 



Valores de X 


frecuencias 


Productos 




fi 


f,X, 


0 


1 


0 


1 


4 


4 


2 


7 


14 


3 


6 


18 


4 


2 


8 


Total 


20 


44 






resultando: 



x = • ,=l 



20 



44 „„ 

= — = 2 . 2 . 
20 



2b) Media para datos tabulados por intervalos 

Si n valores de alguna variable X estan tabulados en una distribucion de 
frecuencias de k intervalos. donde: 

/n, , m 2 m k son las marcas de clase , y 

/, , / 2 f k son las frecuencias absolutas respectivas, 

entonces. su media aritmetica es el numero: 

tin, 

J = ^ 

n 



EJEMPLO 2.8 

Calcular la media de la distribuci6n de frecuencias de los 45 mgresos 
quincenales del ejemplo 1.3. 
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SOLUCION 

La distnbucion de frecuencias del ejemplo 1.3 se repite en el cuadro 2.3. donde 
se ha mcluido una columna de productos f i m i 



Resultando, 




$2702 

45 



$60.04. 



Cuadro 2.3. Calculo de la media aritmetica de los ingresos 
de una muestra de 45 personas 



ingresos 

h 


Marcas 

m, 


N#.personas 

fi 


Productos 


[26,34[ 


30 


1 


30 


[34.42[ 


38 


2 


76 


142,50[ 


46 


4 


184 


[50,58[ 


54 


10 


540 


[58.66[ 


62 


16 


992 


[66,74[ 


70 


8 


560 


[74,82[ 


78 


3 


234 


[82.90] 


86 


1 


86 


Total 




45 


2702 



NOTA. Observar que la media de los 45 datos sin tabular es $59. 6. La media 
obtemda por el metodo de distribucion de frecuencias por mtervalos es una media 
aproximada. 



NOTA. La media aritmetica de datos tabulados. se calcula tambien, utilizando las 

frecuencias relativas (o porcentajes). haciendo, h ! = fjn* i- 1.2 k . En el cast) 

de datos agrupados por inter\alos. se tiene. 

Z-f'"'- ; 

x = — = y /i, m t 

n 



NOTA (Media aritmetica de la poblacion). La media aritmetica de una poblacion 

denotamos por p. Si la poblacion es finita de tamano N con valores a, , x 2 A \ , 

la media es el numero: 







N 
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2.4.2 Propiedades de la media aritmetica 

1) La suma total de n valores cuya media es x es igual a nx . Para n datos no 
tabulados y tabulados respectivamente, se tiene: 

n k 

Z =«*• 

1=1 1=1 

2) Si cada uno de los n valores es transformado en: y ( — ax t +b , siendo a y b 
constantes, entonces, la media de los n valores y t es (verificar!): 

y - ax + b. 

Como casos particulares se tiene: 

Si y # = b , entonces, y — b . Esto es, si los n datos son iguales a una constante, 
entonces su media es igual a esa constante. 

Si y t = x i ? + a , entonces, y = x + b . Esto es, si a cada dato se suma una 
constante la media queda sumada por esa constante. 

Si y i =ax j , entonces, y = ax. Esto es, si a cada dato se multiplica por una 
constante, la media queda multiplicada por esa constante. 

3) La suma algebraica de las desviaciones de n datos x t con respecto a su media 
x, es igual a cero. Para datos no tabulados, y tabulados, se tiene 
respectivamente: 

n k 

5>. - *) = o, (x, -x)=o. 

1=1 i=i 

4) La suma de los cuadrados de las desviaciones de n datos con respecto a su media 
es minima. Para datos no tabulados, por ejemplo, 

n 

^(jc- -c ) 2 = minima, sic = Jc. 

i=i 

En efecto, si c es cualquier numero real, 

n n n n 

~ c ) 2 =X( JC ' ~ x+x ~ c f ='%y. x i -*) 1 +2 (x-cjyy.Xj -x)+n(x-c) 2 . 

i= 1 f=l 1=1 M 

n n n 

-c) 2 = ^(x, -x) 2 +n(x-c) 2 , yaque -x) = 0. 

1=1 1=1 1=1 
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n n 

X ( *> -c) 2 > ^T(x f - x ) 2 , yaque /i(.r -c) 2 > 0. 

j=l i=I 



NOTA. (Media aritmetica ponderada). 

La media aritmetica de los valores x l ^x 2 ,^.,x k ponderada por los pesos 
w, , w 2 w* es el numero: 



WjJt, + w 2 x i + •■• + w k X k 
W\ + w 2 + ... + w k 




For ejemplo, si un alumno en el semestre anterior ha obtenido 11 en el curso A 
de 5 creditos, 13 en el curso B de 4 creditos, y 16 en el curso C de 3 creditos, 
entonces, su promedio (ponderado por los creditos) es, 



_ 11x5 + 13x4 + 16x3 155 

x ~ = = 1 2.92. 

5 + 4 + 3 12 



En realidad, toda media aritmetica es ponderada. En el caso de datos no 
tabulados, el peso de cada valor de la variable es igual a uno. 

Los pesos pueden ser tambien numeros relativos o porcentajes. 

Por ejemplo, si en este mes el aumento de los alimentos fue del 5%, de 
vivienda el 10% y de educacion 8 %. Entonces, el aumento promedio en los tres 
rubros para una persona que gasta el 40% de su sueldo en alimentos, el 35% en 
vivienda y el 25% en estudios esta dado por: 

x = 0.05x0.4+0. 10x0.35+0.08x0.25 = 0.075. 



Pero el aumento promedio en los tres rubros para una persona que gasta 
S/. 1 ,200 en alimentos, S/.600 en vivienda y S/. 1 ,000 en estudios esta dado por: 

_ 0.05x1200 + 0 10x600 + 0.08x1000 200 

jc = — = = 0.0714. 

1200 + 600+1000 2800 



NOTA. (Media aritmetica total a partir de medias de sus partes). 

La media del total de datos es igual a la media ponderada de sus partes donde 
los pesos son los tamanos respectivos. 

Esto es, si n datos de variable X, consiste de k partes de tamanos respectivos 
n y ,n 2 ^-^n k y medias respectivas x y ,x 2 x k , entonces, la media del total de 
datos es igual a: 
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X = 



n x x x +n 2 x 2 + ... + n k x k 
n x +n 2 + ... + n k 



Por ejemplo, si en un examen, 110 alumnos de la seccion HI obtuvieron una 
media de 12.6 y 120 alumnos de la seccion H2 obtuvieron' un promedio de 13.48, 
entonces, los 230 alumnos en conjunto obtuvieron el promedio 



_ 1 10 x 12.64* 120 x 13.48 

jc = = 13.06. 

110+120 



EJEMPLO 2.9 

Los sueldos del mes de enero de 200 empleados de una empresa tienen una 
media de $230. 

a) Si el 60% de los empleados son hombres (el resto son mujeres) y tienen un 
sueldo promedio de $ 250, ^cuanto es el sueldo medio de las mujeres en enero? 

b) Si en el mes de julio, se propone un aumento del 30% a cada sueldo de enero 
mas una bonificacion de $30 ^cuanto dinero adicional necesilara la empresa 
para pagar los sueldos de julio? 

SOLUCION 

a) Sean x , x x y x 2 las medias total, de hombres y de mujeres respectivamente. 
Entonces, 

_ n x x x + n 2 x 2 n, _ n 2 

x h x x x + h 2 x 2 , donde h x , h 2 — 

n x + n 2 n x + n 2 /?, + n 2 

Luego, 230 = 0.6 x 250 + 0.4 x x 2 , entonces, x 2 = 200 . 

b) Sean X: sueldos de enero, Y: sueldos de julio. Entonces, 

Y = X +0.30X +30-1 3X +30 
y = 1 3x + 30 - 1 .3(230) + 30 = 329 

Total de dinero para pagar sueldos de enero = /i(jc) = 200(230) = $46,000 
Total de dinero para pagar sueldos de julio = n(y) - 200(329) = $65,800 
Dinero adicional para pagar sueldos de julio = $65,800 - $46,000 =$19,800. 

EJEMPLO 2.10 

Con los datos del ejemplo 2.3. Determine el lugar de reunidn de manera que el 
costo total del transporte sea mfnimo, si el costo de cada transporte es proporcional 
al cuadrado del recorrido. 
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SOLUCION 

Sea K el lugar de reunion. Dado que el costo del transpose es proporcional al 
cuadrado del recorrido, el costo total del transporte es: 

Este costo total sera mfnimo, si K es la media de los 5 valores 0, 20, 35, 4 1 , 5 1 , 
esto es si K =29.4. Luego, deben reunirse en un lugar a 29.4 Km. de A ubicada en 
la carretera. 

EJEMPLO 2.11 

Un conjunto de n articulos cuyos valores de venta serian de $5 en el 30% de los 
casos, $7 en el 45 % de los casos y 10$ en el 25% de los casos, tiencn un costo de 
production fijo de %k. Hallar el valor de k si se quiere hacer una inversion minima y 
si se supone que la inversion es igual a la suma de los cuadrados de todas las 
utilidades. 

SOLUCION 

La inversion es: (5 — k) 2 en el 30%) de los casos + (7 — k) 2 en el 45% de los 

casos + (10 — k) 2 en el 25% de los casos. La inversion es minima, si k es la media 
de los datos: $5 con frecuencia 0.30, $7 con frecuencia 0.45 y $10 con frecuencia 

0.25. Esto es, si 



A: = 5 x 0.3 + 7 x 0.45 + 1 0 x 0.25 = $715 



NOTA. (Defectos de la media aritmetica) 

1. La media aritmetica depende de todos los valores observados, en consecuencia es 

"afectada" o “sesgada” por valores extremos. Por ejemplo, la media 
aritmetica de los grupos: 

a) 55,56,57,58,59,60 es igual a x x =345/6 = 57.5. 

b) 55,56,57,58,59, 100 es igual a x 2 =385/6 = 64.2. 

c) 55, 56, 57, 58, 59, 0 es igual a 3c 3 = 285/6 = 47.5 . 

Como se puede observar, la media aritmetica es sesgada por los valores 
extremos: 100 en el grupo b) y 0 en el grupo en c). 

2. La media aritmetica puede ser calculada tambien en distribution de frecuencias 
por intervalos de amplitud diferentes, siempre que puedan determinarse los 
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puntos medios (marcas) de las intervalos . Por ejemplo, no se puede calcular la 
media a partir de una distribucion de frecuencias como del cuadro 2.4. 
(Tambien no se puede calcular la mediana y la moda, ^por que?) 



Cuadro 2.4 



Intervalos 


Frecuencias 


menor o igual que 20 


50 


[20, 25[ 


20 


25 o mas 


10 



2.5 Relation entre media, mediana y moda 

1. Si la distribucion de frecuencias es simctrica, entonces, la media, la mediana y 
la moda tienen el mismo valor (figura 2.2(a)). Esto es. 



x = Me = Mo . 



x — Me - Mo 





fig. 2.2. (a) 



fig. 2.2. (b) 



fig. 2.2. (c) 




2. Si la distribucion es asimetrica de cola a la derecha. entonces, la moda es 
menor que la mediana y esta a su vez es mcnor que la media (figura 2.2(b)) Es 
decir : 

Mo < Me < x . 



3. Si la distribucion es asimetrica de cola a la izquierda, entonces, la relacion cs 
(figura 2.2(c)): 



x < Me < Mo . 
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4. Para distribuciones unimodales y asimetricas, se tiene la siguiente relacion 
empirica: 



5. Los tres promedios pueden calcularse tambien para distribuciones de 
frecuencias con intervalos de diferente longitud, siempre que puedan 
determinarse o las marcas de clase (para la media) o el lfmite inferior L { del 
intervalo (para la mediana y la moda). 

2.6 Uso de los promedios 

1. De los promedios definidos, la media aritmetica se usa con mas frecuencia por 
su mejor tratamiento algebraico. Pero no siempre es un buen promedio. 

2. Si la distribution de frecuencias es simetrica (o "casi" simetrica), la media, o la 

mediana o la moda es el promedio representativo, piles, en este caso, los tres 
promedios son iguales (o casi iguales). 

3. Si la distribucion tiene marcada asimetria, entonces, la mediana es la medida 
promedio mas representativa. 



La media geometrica 

Definition. La media geometrica de n valores positivos x x , x n es el 
numerox c que se define como la rafz enesima del producto de estos n valores Esto 
es, 



La media geometrica se utiliza para promediar: razones ( alb), indices (alb en %) t 
proporciones ( a/(a+b )), tasas de cambio (a-b)/b, que varian con el tiempo, entre 
otros. 



X -Mo = 3(X -Me). 



2.7 Otras medias 




Por ejemplo, la media geometrica de los valores 3, 9, 27 es igual a: 



x c = 3 x 9 x 27 = 9. 
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EJEMPLO 2.12 

Si una production ha experimentado un crecimiento del 30% del primero al 
segundo ano y un incremento del 35% del segundo al tercer ano y un decree! miento 
del 15% del tercer al cuarto ano. 

a) Calcular la tasa promedio de crecimiento de los 3 ultimos anos. 

b) Calcular la production del quinto ano, si la del primer ano es 100. 

SOLUCION. 

a) Tomando como production base 100 para el primer ano. 

En el segundo ano, el porcentaje de crecimiento es de 30%, la production cs: 
1 00 + 0. 30 x 1 00 - 1 30 y la tasa de crecimiento es 1 30/1 00 — 1 . 30. 

En el tercer ano, el porcentaje de crecimiento es de 35%, la production es: 
130 + 0.35x 130= 175.5 y la tasa de crecimiento es 175.5/130= 1.35. 

En el cuarto ano. el porcentaje de crecimiento es de -15%, la produccion 
es: 175.5 — 0. 15(175.5) = 149.175 y la tasa de crecimiento es 

149.175/175.5 = 0.85 



Cuadro 2.5. Calculo de la media geometrica 



Ano 


% 

Crecimiento 


Produccion 


Tasas 


1 


— 


100 


— 


2 


30% 


100+0.3(100)- 130 


130/100=1.30 


3 


25% 


1 30+0.35(130)^175.5 


175.5/130=1.35 


4 


-15% 


175.5-0.15(175.5 )=149.175 


149 175/175.5=0.85 



El promedio de las tasas de aumento durante los tres ultimos ahos es la 
media geometrica: 

x r =Vl. 30x1.35x0.85 =1.1426 = 1 + 

100 

Esto es, el porcentaje promedio de crecimiento es de 14.26%. 
b) La produccion para el quinto ano es igual a: 

149 175 + 0.1426x149.175 = 170.44 



EJEMPLO 2.13. 

Suponga que la poblacion de una ciudad aumento de 10,000 a 12,600 en el 
periodo de 1980 a 1984 como se indica en el cuadro 2.5. Determine la tasa media 
del crecimiento. 
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Cuadro 2.5. CSlculo de la media geometnca 



Ano 


Poblacion 


Tasas de cambio(X) 
(ano base 1980) 


logW 


1980 


10,000 


— 


— 


1981 


10,500 


1.050 


0.0212 


1982 


11,200 


1.067 


0.0282 


1983 


12,000 


1.071 


0.0298 


1984 


12,600 


1.050 


0.0212 


total 






0.1004 



SOLUCION. 

Para simpiificar los calculos, se puede utilizar logaritmos en base 10, 



!ogU G ) = 

de donde resulta; 



V log(x, ) 

log(x,) + log(x 2 ) + ... + logUJ " 



n 



n 



x c = anti l°g^ log(x, ) jn 



Para calcular la tasa media de cambio por ano escogemos como base el ano 
1980. Las tasas de cambio se obtienen dividiendo cada dato entre el dato del ano 
anterior. Aplicando la media geom^trica a las tasas se tiene: 



l°g(*c) = 



0.1004 



= 0.025 1, x G = anti log(0.025 1) = 1.0595. 



n 4 

Luego, la tasa promedio de crecimiento es de 5.95% por ano. 



La media armonica 

Definition. La media armdnica de n valores no nulos x } , x 2 x n es el numero , 
x H que se define como el recfproco de la media aritmetica de los reciprocos de 
esos n valores. 

Esto es, 
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n 




Por ejemplo, la media armonica de los valores 6, 4, y 3 es igual a 4. 

La media armonica se utiliza para obtener promedios de valores que estan en 
relacion inversa como la velocidad y el tiempo. En general, se usa para obtener el 
prornedio de un conjunto de valores expresados en forma de tasas de unidades de un 
tipo por unidades de otro tipo (por ejemplo Km/h). 



NOTA. La media armonica es siempre menor que la media geomdtrica Esta a su 
vez es menor que la media aritmetica. Esto es, 

x H <x G <x 



EJEMPLO 2.14 

Una persona mancjando su aulomovil recorre los pnmeros 10 Km. a 60 Km. 
por hora y los siguientes tO Km. a 70 Km. por hora, calcular la velocidad 
media. 



SOLUCION. 

Para recorrer los primeros 10 Km. usa 10/60 horas. Para recorrer los siguientes 
10 Km. usa 10/70 horas. Por lo tanto, para cubrir los 20 Km. (10 + 10) se 
emplearon ( 10/60 )+( 10/70) horas con un prornedio de velocidad de: 

__ Recorrido total 10+10 2 , , , 

x H = = — — = — = 64.6 km/h. 

Tiempo total 10 10 1 1 

60 70 60 * 70 



EJEMPLO 2.15 

Una empresa de transporte gasta $400 en latas de aceite que cuestan $10 la 
docena; $500 en latas quo cuestan $12.5 la docena; $600 mas en latas que cuestan 
$20 la docena y $300 cn otras que cuestan $25 la docena. Calcular el costo 
prornedio por docena de las latas de aceite. 

SOLUCION 



Total dc coslos 
Total de docenas 



400 + 500 + 600 + 300 
400 500 600 300 

10 + 12.5 + 20 + 25 



$14.75 
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EJEMPLO 12.16 

Una propiedad de la media es: “si x } , x 2 , . . . x n tienen media 3c y si la funcion 

1 n 

f{x) es concava hacia abajo, entonces /(3c) > — ^ f(x i ) , \ 

n /=l 

Utilizando la propiedad indicada pruebe que 3c c < 3c , donde 3c c es la media 
geometrica de los datos. 

SOLUCION 

x c = tyJxyX 2 '~x n , entonces, 

1 n 

log(x c ) = - V log(AC, ) < log(x) , donde / = log . Ademas, 
log(x c ) < log(!x), implica. 3c c < 3c , (Dado que / = log es inyectiva) 



EJERCICIOS 



1. Los costos de fabricacion, en soles, de diez objetos son los siguientes: 

9.35, 9.46, 9.20, 9.80, 9.77, 9.00, 9.99, 9.36, 9.50, 9.60. 
si el precio de venta de cad a objeto es 3 veces su costo de fabricacion menos 5 
soles, calcular la utilidad media por objeto. 

Rp y,=3jc— 5, y = 3x — 5 , 3c = 9.503, y = 23.509, utilidad medians/. 14.006 

2. En una evaluacion, 5 alumnos tienen cada uno nota 12, y un alumno tiene 18. Si 

se indica como nota promedio 13, £que nota promedio es?, ^es el promedio 
adecuado?, ^cuanto es el promedio adecuado?. 

Rp. media, no. Me = 12. 
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3. De las edades de cuatro personas, se sabe que la media es igual a 24 anos, la 
mediana es 23 y la moda es 22. Encuentre las edades de las cuairo personas. 

Rp. 22. 22, 24 y 28 

4 . De la curva de frecuencias de los sueldos de 30 empleados de una empresa, se 
sabe que Mo =$200, Me = $220, y x -$250. Califique como verdadera o 
falsa las siguientes afirmaciones, justificando su respuesta: 

a) El sue ldo mas frecuente es de $200 y mas de la mitad de los empleados gana 

mas de esa cantidad. 

b) Con una suma de $3,300 se asegura el pago de la mitad de los empleados y 

con $7,500 el de todos los empleados. Rp. a) si. b) si. 

5. Para calcular el suministro de agua que una ciudad requiere mensualmente, se 
escogen 15 familias de la ciudad, resultando los siguientes consumos en metros 
cubicos: 



11.2, 21.5, 16.4, 19.7, 14.6, 

16.9, 32.2, 18.2, 13.1, 23.8, 

18.3, 15.5, 18.8, 22.7, 14.0. 

Si en la ciudad hay 5,000 familias, ^cuantos metros cubicos de agua se requieren 
mensualmente si el consumo pro medio por familia permanece igual?. 

Rp. media=276.9/15-18.46, consumo estimado=5.000( 18.46)^92300 



6. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos 
alternativas de aumento: 

a) S/. 75 a cada uno, b) 15% de su sueldo mas 10 soles a cada uno. 

Si la empresa dispone a lo mas de S/. 94,000 para pagar sueldos, ^cual 
alternativa es mas conveniente? 

Rp. total a) nl = 200 x 475 = 95000 b) ny = 200 x 470 = 94000 , b 



7. A1 calcular la media de 125 datos, resulto 42. Un chequeo posterior mostro que 

en lugar del valor 12.4 se introdujo 124. Corregir la media. 

Rp. media corregida=4 1 . 1 072. 

8. Las ventas de un distribuidor de automoviles, en cierto periodo, ascendieron a la 

cantidad de $ 1’650,000, vendiendo 50 automoviles nuevos a un precio 
promedio de $ 13,000 y algunos carros usados con un precio de $5000 en 
promedio. ^Cual es el promedio de los precios de todos los automoviles que se 
vendieron?. 

Rp. n 2 =200, media- 1 ,650,000/250=36,600 



9. De los horarios de clases de EE.GG.CC. se sabe que ninguno tiene mas de 100 o 
menos de 70 alumnos matriculados. Se sabe que uno de cada 5 tiene 80 
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alumnos, que el 30% tiene 100 y la mayoria 90 alumnos. Calcular la media 
aritmetica de alumnos por horario. 

Rp. 0.2x80 + 0.5x90 + 0.3x100 = 91 . 

10 . En tres grupos distintos de 100,000, 90,000 y 20,000 personas, el porcentaje de 
personas con educacidn superior es 21%, 42% y 40%, respectivamente. Calcular 
el porcentaje promedio de personas con educacion superior 

Rp. (0.21x100,000 +0.42x90,000 +0.40x20000)/2 10.000 =0.318. 

11 . En un informe (que se supone es correcto) sobre sucldos en todo el pais una 
empresa de estudios de mercados publica la siguiente tabla 





Clase A 


Clase B 


Clase C 


Clase E 


% de poblacion 


10% 


25% 


35% 


30% 


Sueldos 


S/. 2500 


S/. 1500 


S/. 500 


S/. 200 



y concluye diciendo que "la media de los sueldos en todo el pafs es S/1 175". 

a) ^Que comentario le merece el informe?. Si no esta de cuerdo, <,cual serfa la 

correction? 

b) ^Es la media en este caso el promedio representative?, si no esta de acuerdo, 

^cuanto es el promedio adecuado?. 

Rp. a) Media correcta=2 500x0. 1+1 500x0.25+500x0.35+200x0.30=860.. b) Mediana=$500. 



J0 

12 . De una central telefonica salieron 70 llamadas de menos de 3 minutos, 
promediando 2.3 minutos, 40 llamadas de menos de 10 minutos pero no menos 
de 3 minutos, promediando 6.4 minutos, y 10 llamadas de al menos 10 minutos, 
promediando 15 minutos. Calcular la duration promedio de todas las llamadas. 

Rp. 4.725 minutos 

13 . Cuatro fabricas A, B, C y D, producen un mismo objeto. La fabrica B produce 

el doble de C, la D 10% menos que la C y la A el 60% menos que la B. Los 
costos de production (en dolares) por unidad de estas fabricas son 
respectivamente: 0.2, 0.3, 0.2, y 0.5. Calcular el precio medio de venta si se 
quiere ganar el 20% por unidad. Rp. l 692/4.7=0 36 

14 . El sueldo medio de los obreros de una fabrica es de $286. 

a) ^Que porcentajes de hombres y mujeres trabajan en la fabrica si sus sueldos 
medios respectivos son $300 y $260?. 

b) Si el 60% de los obreros tienen menos de 30 anos y percibe el 20% del total 
de los sueldos, ^cuanto es el sueldo medio de los obreros de al menos 30 
anos?. . 

Rp. a) 65% y 35%. b) 286NxO.8/0.4N =572$ 
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15. En una empress donde el sueldo medio es de $400 se incrementa un personal 
igual al 25% del ya existente con un sueldo medio igual al 60% de los antiguos. 
Si 3 meses mas tarde se incrementan cada sueldo en 20%, mas 30$, ^cuanto es 
el nuevo salario medio?. 

Rp. [510«+3 1 8(0.25«)]/l .25«=$ 471.6. 

16. En el presente mes, 9 vendedores realizaron las siguientes ventas en dolares: 



Vendedor 


1 


2 


3 


4 


5 


6 


7 


8 


9 


Venta ($) 


800 


700 


500 


400 


1000 


1200 


820 


750 


450 



a) i Cuanto es la media de las ventas? 

b) <\Quien es el vendedor promedio? 

Rp. a) $735.56, b) Promedio es la mediana=750. que corresponde al vendedor 8 

17. Al tabular las calificaciones de un examen se obtuvieron las siguientes notas: 
07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17 y las frecuencias del numero de 
alumnos respecti vas: 1, 1, 1, 1, 1, 6, 8, 16, 18, 20, 2. 

a) 6 Cuanto es la media, la medians y la moda de las notas?, ^que valor escogeria 

como el promedio?. 

b) ^Cuanto es la nota minima para estar en el quinto superior?. 

Rp. a) x =14.253. Me=\5, Mo= 16, , la Me , b) 16. 



18 . Los sueldos en una empresa varfan de $300 a $800 distribuidos en forma 
simetrica en 5 intervalos de igual amplitud, con el 15%, 20%, y 30% de casos 
en el primer, segundo y tercer intervalo respectivamente. 

a) Calcule los diferentes indicadores de tendencia central. 

b) Si se aplica un impuesto a los sueldos localizados en el cuarto superior, ^a 
partir de que sueldo se paga el impuesto?. 

Rp. a) x =Afe=A/o=550, b) 650$ 

19 . A una muestra se aplico un test para medir autoestima y los puntajes se 
tabularon en una distribucion de frecuencias de 5 intervalos de igual amplitud, 
siendo la puntuacion minima 25, la tercera marca de clase 62.5, Si las 
frecuencias en porcentajes del primero al tercero son: 5, 15, 25, y si y el 90% de 
las puntuaciones son menores que 85 

a) calcule el promedio adecuado. 

b) y si se considera normal una autoestima comprendida entre 58 y 80 puntos, 
^que porcentaje de la muestra no tiene autoestima normal?. 

Rp. frecuencias 5, 15. 25, 45. 10, a) Me = 71.67, b) 50% 

20 . En un estudio comparative del porcentaje de rendimiento de ciertos bonos se 
elaboro una distribucion de frecuencias de 5 intervalos de amplitud iguales, 
siendo las marcas de clase primera y quinta 15 y 55 respectivamente. Si el 65% 
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de los bonos rinden menos del 40%, el 25% menos del 30%, el 90% menos del 
50% y el 95% al menos 20%, 

a) Caleule los promedios de rendimiento. 

b) Si el 50% de los bonos de mayor rendimiento deben pagar un impuesto, <*,a 
partir de que rendimiento corresponde pagar el impuesto?. 

c) ^Es la mediana, el punto medio entre los cuartiles 1 y 3?. 

Rp. a) x mm =\0, 4=10, free. %: 5. 20, 40, 25, 10, x =36.5. Me= 36.25, Mo=35.1. b) 36.25, c) No. 

21 . En una prueba de aptitud mental la menor y mayor puntuacion fueron 50 y 199 
respectivamente. Los puntajes (sin decimales) se tabularon en una distribution 
de frecuencias simetrica de 5 intervalos de igual amplitud donde el 20% de los 
casos son menores 95 y el 70% de los casos son menores que 140. 

a) Hallar el intervalo centrado en la mediana donde se encuentran el 50%> de los 

puntajes. 

b) ^Es el cuartil 2, el punto medio entre los cuartiles 1 y 3?. 

Rp. A = 30, frecuencias 0.1, 0.2. 0.4, 0.2, 0.1, Me = 125, [102.5. 147.5].b) Si. 



22 . El consumo mensual de agua (en metros cubicos) de una muestra de 225 
viviendas, se tabularon en una distribucion de frecuencias simetrica de cinco 
intervalos de amplitud iguales. Si el consumo mfnimo es de 35 m\ el 
consumo promedio de 45 m 3 , y si 1/3 de la muestra consume al menos 43 nr 
pero menos de 47 m 3 . 

a) iQue porcentaje de la muestra consume al menos 47 m 3 ?. 

b) ^Cuantos metros cubicos como mfnimo consumen el 60% de las viviendas 
con mayor consumo?. 

Rp. 4 = 4. a) 75 de 225, b) P40=43.8. 



23 . Los porcentajes de artfculos defectuosos encontrados en un numero 
determinado de cajas recibidas varfan de 10 a 25 y han sido tabulados en una 
distribucion de frecuencias simetrica de 5 intervalos dc igual amplitud, siendo 
las frecuencias relativas respectivas del primero al tercero 0.08, 0.24, 0.36. Una 
caja se considera optima si el porcentaje de defectuosos no supera el 17% y casi 
optima si no supera el 20%. 

a) Calcular el porcentaje de cajas dptimas y casi optimas. 

b) Si las utilidades por cada caja es de 30 unidades monetarias (u.m.) para las 
optimas, 15 u.m. para las casi optimas y 5 u.m, para el resto, ^cuanto es la 
utilidad promedio por caja?. 

Rp. a) Porcentajes de cajas. optimas 44%, casi optimas: 32%. b) Utilidad 
promedio=0.44x30+0.32x 1 5+0.24x5=19.2 u.m 



24 . Los salarios que ofrece una empresa a los practicantes varfan entre $150 y 
270$. Si los salarios se agrupan en cuatro intervalos de clase de longitudes 
iguales de manera que el 40% de los practicantes ticnen salarios menores o 
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iguales que $195, el 80% tienen salarios men ores o iguales que $225 y el 15% 
tiene salarios mayorcs que $232.50. 

a) *‘,Que porcentaje dc praclicanies liene un salario superior al salario medio?. 

b) Si el ingreso mini mo se fija en $240 y la empresa aumenia una misma 
cantidad a todos los practicantcs de modo que el 20% supere el ingreso 
minimo, ^.cuanto seria el aumento?, ^cuanto el salario medio?. 

Rp. a) frecuendas: 0.10. 0.60. 0.20. 0. !0, media=204$. 42%. b)$15.$219. 

25. Cinco personas que viven en los lugares A, B, C, D, y E separadas a las 
distancias en Km., como se indica en la figura que sigue, deben reunirse en 
algun lugar. 



Distancias . 15 10 3 5 



Lugares A B C D E 

Determine el lugar de reunion de manera que el eosto total del transporte sea 
minimo, si el eosto dc cada transporte cs proporcional. 
a) al recorrido, b) al cuadrado del recorrido. 

Rp. a) a 25 Kni. de A b) a 20.2 Km de A 

26. Los pobladores de 6 pueblos: A. B, C, D, E, F ubicados a Io largo de la carretera 
marginal de la selva y en lfnea recta, desean conslruir una escuela. Si la 
poblacion cseolar es: 5% de A, 20% de B a 15 km. de A, 30% de C a 20 km. 
de B 20% de D a 15 km. de C, 10% de E a 8 km. de D y 15% de F a 6 km. de 
E. /,en que lugar debe construirse la escuela de manera que 

a) el total de las distancias sea minima?. 

b) el eosto total del transporte sea minimo si el eosto del transporte es 
proporcional al cuadrado de la distancia?. 

Rp a) 35km. de A. b) a 38.9 km. de A 

27. Un conjunto de n articulos cuyos valores de venta seran de $5, $7 y 10$ con las 
frecuencias respectivas de 20%, 25%, y 55% tienen un eosto de production fljo 
de $k. Hallar el valor de k si se quiere haeer una inversion minima y si se supone 
que la inversion es: 

a) Es igual a la suma de todas las utilidades. 

b) Es igual a la suma de los cuadrados de todas las utilidades. 

Rp. a) &-inediana=$ 1 0, b) L=metlia=5x0.2+7x0.25+l0x0 55=58.25. 



Media Geometrica y armonica 

28. Si la poblacion de una ciudad fue de 10,000 habitantes en 1950, de 40,000 en 
1970 y de 640,000 en 1990, calculc la tasa de cainbio promedio. 

Rp. x G -8 veces eatla 20 ano*. 
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29. Un ahorro de 100$ acumula intereses variables de 3%, 5%, 8%, durante 3 anos, 
calcular: 

a) El monto del ahorro por ano. 

b) La tasa promedio del crecimiento del ahorro en los tres anos. 

c) El porcentaje promedio de crecimiento del ahorro 

Rp. a) 103, 108 15, 116.802, b) x G =1.053 13. c) 5.31% 

30. Si la produccion de azucar en 1991 bajo 20% con relation al ano 1990 y si en 
1992 aumento en 20% con respecto a 1991, calcule la tasa promedio del 
crecimiento de la produccion. 

Rp. x G =0.9798%, bajo 2% 



31 . En cuatro meses consecutivos los precios de un articulo fueron $500. $550, 

$440, y $462 respectivamente, ^es la tasa de variacion promedio igual al 
-1 6.7%?., si no es asi, ^cuanto es?. Rp. No, es -2.6%. 

32 . El crecimiento de la poblacion estudiantil. con respecto al semestre anterior fue 
como sigue: aumento 10% en el segundo, aumento 20% en el terccro, y bajo 
15% en el cuarto. Encuentre la tasa promedio de crecimiento en los tres 
semestres. 

Rp. media geornctrica dc: 1 I. 1.2. 0.85, cs 3 91%. 



33 . El rendimiento de 3 automoviles que recorrieron 200 km. cada uno fue de 50, 

45, y 60 kilometros por galon. Hallar el rendimiento promedio de los 3 
automoviles. Rp. x H =50.94 

34 . Tres mecanografas escriben 40, 50, y 80 palabras por minuto, si cada una de 
ellas escribe un mismo texto, calcule la velocidad media. 

Rp x H =52.2 

35 . Tres obreros utilizaron 480, 360, 240 minutos respectivamente para hacer cierto 

tipo de objetos. Si utilizaron 0.8, l, 1.5 minutos por objeto, calcular el tiempo 
promedio por objeto. Rp. x H =1080/1 120=0.96 

36 . Una estacion de servicio automotriz gasta $500 en latas de aceite que cuestan 
$10 la docena; $500 en latas que cuestan $12.5 la docena; $500 mas en latas que 
cuestan $20 la docena y $500 en otras que cuestan $25 la docena. 

a) Determinar el costo promedio por docena de las latas de aceite. 

b) En promedio, ^cuantas docenas se compro?. 

Rp a) 2,000/135= 14.8148. b) 135/4=33.75 
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37. Durante los dfas lunes, martes, miercoles, jueves, y viernes Una persona A 
compro 70 acciones cada dfa de la Companfa WWW . Otra persona B invirtio 
diariamente S/,1800 para comprar acciones de dicha companfa. Si los precios 
de las acciones cada dia fueron como sigue* 



Lunes 


20 


Martes 


22.5 


Miercoles 


24 


Jueves 


25 


Viernes 


30 



a) Determiriar el costo promedio por accion para cada una de las dos personas. 

b) ^Quien consiguio el menor costo promedio por accion?. 

Rp. a) A: 8505/350=24.3, B 9000/377=23.87, b)B 



38. Una propiedad de la media dice que si son n valores positivos con 

media x y si la funcion J[x) es concava hacia arriba, entonces 

1 n 

/(J) < — y^/Qy-). Utilizando la propiedad indicada pruebc que x H <x . 



donde x H 



n 



z 

1=1 






es la media armomca de los datos. 
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MEDIDAS DE DISPERSION 



3.1 Introduction 

Las medidas de tendencia central no son suficientes para describir un conjunto 
de valores de alguna variable estadfstica. Los promedios determinan el centro, 
pero nada indican acerca de como estan situados los datos respecto al centro. 

En primer lugar se necesita una medida del grado de dispersion o variabilidad 
con respecto al centro con la finalidad de ampliar la descripcion de los datos o de 
comparar dos o mas series de datos. 

En segundo lugar se necesita una medida del grado de asimetria o deformacion 
en ambos lados del centro de una serie de datos, con el fin de describir la forma de 
la distribucion de los datos. Esta medida se denomina indice de asimetria. 

En tercer lugar se necesita una medida que nos permita comparar el 
apuntamiento o curtosis de distribuciones simetricas con respecto a la distribucion 
simetrica normal. Esta medida se denomina indice de apuntamiento o curtosis. 

Las estadfsticas de asimetria y apuntamiento se incluyen en este capitulo dada su 
poca importancia. 

El lector deberia correr paquetes de computo entre otros el MCEST para las 
aplicaciones de este capitulo. 



3.2 Medidas de dispersion 

Las medidas de dispersion o variabilidad son numeros que miden el grado de 
separation de los datos con respecto a un valor central, que generalmente es la 
media aritmetica. 

Las principals medidas de dispersion son: 
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el rango, 

el rango intercuartil, 
la varianza , 

la desviacion estandar , y 
el coeficiente de variacion. 



3.2.1 Rango o recorrido de una variable 

Definicion. El rango de variacion o recorrido, R, de una serie de datos. es la 
diferencia entre sus valores maximo y minimo. Esto es, 

^ ^max -^min 

siendo x max el valor maximo y x min el valor minimo. 

El rango es una medida de dispersion muy facilmente calculable, pero es muy 
inestable, ya que depende unicamente de los dos valores extremos. Su valor puede 
cambiar grandemente si se anade o elimina un solo dato. Por tanto su uso es mu> 
limitado. 

Por ejemplo, dadas las dos series de datos 

a) 1, 4, 4, 5, 5, 5, 5, 6, 6, 9 

b) 1, 2, 3, 4, 5, 6, 7, 8, 9 

Ambas series tienen la misma media, 5, y el mismo rango, 8, pero las dos series no 
tienen la misma dispersion, ya que la segunda riene mayor variabilidad. 

El empleo del rango como medida de comparacidn de variacion puede estar 
justificado cuando se precise rapidamente de una medida de dispersion > no 
haya tiempo de calcular algunas de las otras. 



3.2.2 Rango intercuartil y rango semiintercuartil 

Definicion. El rango intercuartil, RI, es la diferencia entre sus cuartiles tercero y 
primero. Esto es. 



RI=Qi~Q\ 



El rango intercuartil es una medida que excluye el 25% mas alto y el 25% mas 
bajo, dando un rango dentro del cual se encuentra el 50% central de los datos 
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observados y a diferencia del rango total no se encuentra afectada por los valores 
extremos. 

Si el rango intercuartil es muy pequeno entonces describe alta uniformidad o 
pequena variabilidad de los valores centrales 

Por ejemplo, si en una distribucion de frecuencias de 100 ingresos quincenales 
se encuentran los cuartiles Q x = 62$ , y Q$ = 70$ , entonces, el rango intercuartil es 
RI = 0 3 - Q } = $70 - 62$ = 8. Esto, indica que el 50% de los ingresos quincenales 
de los 100 empleados vana dentto del valor $8. 

E1 rango intercuartil se apliga a variables medidas m e&cala por lo ipenos 
ordinal. 

Definition. El rango semiintercuartil, RSI, es igual at rango intercuartil dividido 
por 2. 

El rango semiintercuartil se puede asociar con la mediana y se puede expresar en 
funcion de ella. Si una distribucion es normal los cuartiles £), y £? 3 son 
equidistantes de la mediana. Se deduce entonces, que el rango intercuartil y la 
mediana ± RSI , son la misma distancia. Ademds, como exactamente el 50% de los 
datos se encuentran en el rango intercuartil, entonces, el intervalo: mediana ± RSI 
contiene tambien exactamente el 50% de los datos. Si la distribucidn es asimetrica, 
el intervalo: mediana ± RSI contendna aproximadamente el 50% de los datos. 

Por ejemplo, si en la distribucion de los 100 ingresos quincenales donde 
Q x =62$ , y £) 3 =70$ , el rango semiintercuartil es $4 Si la mediana fuera igual a 
$66, entonces, aproximadamente el 50% de los datos se hallan comprendidos en el 
intervalo $66 T 4. 

NOTA. Si la distribucion es niuy asimetrica, el rango intercuartil (o el 
semiintercuartil) es preferible a la desviacion estdndar como medida de la 
dispersion. 



3.2.3 Varianza y Desviacion estandar 

La varianza, es una medida que cuantifica el grado de dispersion o de variation 
de los valores de una variable cuantitativa con respecto a su media aritmetica Si los 
valores tienden a concentrarse alrededor de su media, la varianza ser£ pequena. Si 
los valores tienden a distribute lejos de la media, la varianza ser3 grande 

La varianza calculada a partir de una muestra ser£ denotada por s 2 y refenda a 
una poblacion se denotara por a 2 . 

Definicidn. La varianza se define como la media aritmetica de los cuadrados de 
las diferencias de los datos con respecto a su media aritmetica. 
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La varianza es una medida de dispersion con unidades de medicion al cuadrado. 
por ejemplo, $\ Km 2 , etc. 

Definicion. La desviacion estdndar es la raiz cuadrada positiva dc la varianza 

La desviacion estandar calculada a parti r de una muestra se denotara por s y 

referida a la poblacion por a . Esto es, s = ^js 2 . a= a 2 



Calculo de la varianza 
1) Varianza de datos no tabulados 

La varianza de n valores x n , de alguna variable cuantitaliva X cuya 

media es x , es el numero: 

£<*,• -X ) 2 

s 2 =^ 

n 

n n 

Es facil verificar que: ^(.v, — x ) 2 = ^T^xf — nx 2 

/=1 i=l 

Por lo tanto. 



n 




n 



EJEMPLO 3.1 

Calcular la varianza y la desviacion estandar de los 45 ingresos quincenales sin 
tabular del ejemplo 1.3 

SOLUCION 

n 

J>, 2 = 1 66,244$ 2 



s 2 =^ 1 -x 2 = — - (59.6) 2 = 1 42. 1 5 1 $ 2 . 

n 45 

Mientras, que la desviacion estandar es 



V" - 2682 

n = 45 , 2_, x, = 2682$. X = — =59.6. 



1=1 



45 



Luego. la varianza es el numero 






1 AA OAA 
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s = ms 2 = v 142. 151 = 1 1 . 923 $ 

Obser\ar que la varianza esta en $ 2 , mientras que la desviacion estandar esta en $ 



2) Varianza de datos tabulados 



2a) Variable discreta 



La varianza de n valores de una variable estadistica discreta X que se clasifican 
en k valores distintos x y , x 2 ,...,x k con frecuencias absolulas respectivas 
/l ,/t , y cuya media aritmeticaes 7 se calcula utilizando la formula: 



Se verifica que 
Por lo tanto, 



i=i 

n 



]£/.<■*.• ~ x) 2 = lLf' x ' ~ nx2 



k 




n 



EJEMPLO 3.2 

Calcular la varianza y la desviacion estandar del numero de hijos de la muestra 
de 20 familias del ejemplo 1.2. 

SOLUCION. 

La distribucion del ejemplo 1 ,2 se repite en el cuadro 3.1 donde se ha insertado 
una columna de productos /, ( v, ) 2 

A , 44 7 

Entonces, rc = 20, /c =5, =44, x = =2.2, / f.x; =118 

i=i 20 Ias| 

Luego, la varianza es el numero 
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5 2 =^- 






118 



— X - 



— (2.2) 9 = 1.06 hijos 2 



n 20 

La desviacion estandar es: s = *\ls 2 = .06 = 1 .03 hijos. 



Cuadro 3.1 Computo de la varianza: 
Caso dc variable discreta 







f, x i 


fx 


0 


1 


0 


0 


1 


4 


4 


4 


2 


7 


14 


28 


3 


6 


18 


54 


4 


2 


8 


32 


Total 


20 


44 


1 18 



2b) Varianza de datos tabulados por intervaios 

La varianza de n valores de alguna variable X, tabulados en k intervaios, con 
marcas de clases m x , ni 2 m k , frecuencias absolutas respectivas /, , f 1 f k \ 
con media x es el numero: 



i 

s~ 



YjU™; - x) 2 

1=1 

n 



Se puede verificar que: 




- nx 



2 



Por lo tanto. 



2 

S~ 



k 




- X 



n 



EJEMPLO 3.3 

Calcular la varianza y la desviacion estandar de los 45 ingresos quinccnaies 
tabulados del ejemplo 1.3. 
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SOLUC10N. 

La distribucion del ejemplo 1.3 se rcpile en e] cuadro 3.2 donde sc ha inscrtado 
una columna de productos f m~ . 

Cuadro 3.2. Calculo de la varianza para datos agrupados por intervalos 



Ingresos 

i, 


M areas 

m , 


N#.Personas 

f, 


Productos 


Productos 

f,m; 


[26,34[ 


30 


1 


10 


900 


[34,42[ 


38 


2 


76 


2888 


[42.50[ 


46 


4 


184 


8464 


[50.58[ 


54 


10 


540 


29160 


[58,66[ 


62 


16 


992 


61504 


[66.74[ 


70 


8 


560 


39200 


[74,82[ 


78 


3 


234 


18252 


[82,90] 


86 


1 


86 


7396 


Total 




45 


2702 


167764 



n = 45, k- 8, 



S />, 



= 2702, 



- 2702 

x = 

45 



60.044. 



V f nr = 167.764 



Luego, la varian/a es el numero 



< 




n 



167.764 

45 



(60.044 y 



122.754 $ 2 



La desviacion estandar es: s = '\ls 2 = \ 1 22.754 = 1 1 .079 dolares. 
Observar que la varianza dc los mismos datos no tabulados es 142. 151$ 



NOTA (Calculo de la varianza con frecuencias relativas) 

La varianza se calcula tambien con frecuencias relativas to porcentajesj. En 
efecto. si se liace h f = f t n en la varianza de datos tabulados, se tiene 



k k 

s 2 = ^ h m 2 — x . donde x = ^ h,m 

.=i ,=i 



NOTA (Varianza poblacional) 

La varianza cT de una poblacion fimta de A f datos a,.*;. \\ sin tabular > 

cuva media es pi, se define por: 
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£c*-io’ 



a 2 = — 



1 = 1 



TV 



yv 






Si formamos todas las muestras posibles de tamano n y calculamos sus 
varianzas utilizando la formula s 2 — ^ (x f -x) 2 /n , resulta que la media de 
todas estas varianzas vale: 



n 

Para que la media de todas las varianzas sea igual a a 2 , basta multiplicar a s 2 
por n/(n-l) . Por esta razon, algunos autores definen la varianza (en estadistica 

descriptiva ) con denominador n — 1 . Estas 2 varianzas se tratan en el capftulo 9 de 
estimation de parametros. 



3.2.4 Coeficiente de variation 

Definition. El coeficiente de variation, C.V. es una medida de dispersion relativa 
(libre de unidades de medidas), que se define como la desviacion estandar dividido 
por la media aritmetica. Esto es, 

C.V. = — , o en % 
x 

El coeficiente de variacion se utiliza para comparar la variabilidad de dos o mas 
series de datos que tengan medias iguales o diferentes o que tengan unidades de 
medida iguales o diferentes (por decir, una serie en kilogramos y otra serie en 
metros). 

Por dar un ejemplo, si dos secciones HI y H2 de matematica I, tienen la misma 
desviacion estandar igual a 14, no podemos concluir que los dos horanos tienen la 
misma variabilidad. Asi mismo, si las desviaciones estandares de HI y H2 son 
iguales a 2 y 4 respectivamente no podemos concluir que las notas de H2 son mas 
dispersas que las de HI. La variabilidad depende de las medias de los dos grupos. 

Si la media del horario HI es 16 y la media del horario H2 es 11, los 
coeficientes de variacion respectivos son: 

C.V, . = — = — = 0.875, o87.5%, C.V,. = ^ — = 1.27 ol27% 

Xj 16 x 2 11 

Es decir, las calificaciones obtenidas en HI son mas homogeneas o tienen 
menor variabilidad que las calificaciones del horario H2. 
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3.2.5 Uso de las medidas de dispersion 

La varianza viene expresada en unidades cuadraticas en las que vienen 
expresados los datos. La desviacion estandar viene expresada en las mismas 
unidades en las que vienen expresados los datos. El coeficiente de variaci6n viene 
expresada en numeros abstractos (supi imiendo las unidades en las que vienen 
expresados los datos) 

1) Si dos o mas series de datos (observados en el mismo tipo de medicion) 
tienen medias aritmeticas iguales (o casi iguales) es mas dispersa la serie que 

tiene mayor medida de variabilidad Rango, o /?/, o s 2 , o $, o CV. 

Si hay marcada asimetria, es preferible eomparar con el rango intercuartil 

2) Si dos o m£s series de datos, no tienen medias iguales (o casi iguales), o no 
tienen las mismas unidades de medicion, entonces, es mas dispersa la sene 
que tenga mayor coeficiente de variacion. 

NOTA (Valores estandarizados) 

Cuando se necesiten eomparar valores observados que pertenecen a diferentes 
distnbuciones de datos, las que difieren en su media aritmetiea o en su varianza, o 
difieren en el tipo de unidad de medida, entonces se usa el valor estandar Z que se 
define 



s 

El lector puede verificar que la variable Z estandariza cualquier media en 0 y 
cualquier varianza en 1 . (Probar que: z=0. y 4=1) 

EJEMPLO 3.4 

En una evaluacion de Matematicas e Histona resultan las medias 13 y 17 y las 
desviaciones estandar 3 y 4, respectivamente. Si un alumno obtiene 14 en 
Matematicas y 16 en Histona, ^en cual de los dos cursos tiene mejor rendimiento 
relativo?. 

SOLUCION 

El hecho de que tenga 16 en Historia y 14 en Matematicas no significa que tiene 
mejor rendimiento en Historia. 

Se deben calcular los rendimientos relativos con la puntuacion estandarizada Z 
14-13 

En Matematicas z = = 0.333 
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En Historia z = -0.25 

4 

En consecuencia, tiene mejor rendimiento relativo en Matematicas. 



3.2.6 Propiedades de la varianza. 

1) La varianza es un numero real no negativo y viene expresada en unidades 
cuadraticas. Mientras, que la desviacion estandar viene expresada en las mismas 
unidades en las que vienen expresados los datos. 

2 ) Dadas, la media x y la varianza s 2 de n datos de una variable X, la suma total 

de los cuadrados de los valores es igual a n(s~ + x ) . Para datos no tabulados 
se tiene por ejemplo, 



X*, 2 =n(S^ + x 2 ) 
i = 1 

3) Si cada uno de n los valores x i es transformado en y- t —ax i + b, entonces, la 

varianza de los n valores y i es, ~ a 2 s 2 x (verificar!). 

Consiguientemente, s Y = 

Como casos particulares se tiene: 

Si y t =b, entonces, ^ = 0. Es decir, si los n datos son iguales a una 
constante, entonces, su varianza es igual a cero. 

Si v = X; + b , entonces, s 2 ~ s 2 • Es decir, si sumamos a cada dato una 
constante, la varianza (y la desviacion estandar) no cambian. 

Si y i = ax i , entonces, — a 2 s 2 x - Es decir, si multiplicamos a cada dato por 
una constante, a , la varianza de los nuevos valores es igual que la varianza 
de los antiguos valores multiplicada por a ~ . 

4 ) La varianza y la desviacion estandar pueden ser calculadas tambien en 
distribucion de frecuencias de intervalos de amplitud diferentes, siempre que 
puedan determinarse las marcas de las clases. Por otra parte, dependen de 
todos los datos y son sensibles a la vanacion de cada uno de estos. Basta que 
uno de los datos varie, para que varien aquellas. 
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$) Dados k series de datos con tamanos, medias y vananzas respectivas 

,s, 2 , n 2 . 3 c 2 ,^ 2 ’ ...» n k Jc k , . entonces. la vananza, 5 ^, 

n f + + ... n k =n datos es: 



z 



*> i=» 

sf~ — 



n 



+ 




de 



los 



6 s Desigualdad de Chebyshev 

Cualquiera sea la forma de la distribucion de frecuencias (simetrica o 
asimetrica), el intervalo [x - ks x , x + ks x ] , k > 1 contiene por lo menos el 

1 — \r en % de los datos. 
k 2 

El porcentaje de datos que se hallan fuera del intervalo cs menor que el 



Por ejemplo. el intervalo [x — 2s x ,x + 2s x ] contiene por lo menos el 
1 — V = *7 o 75^. de los datos 

hi inter* 1 [.v -3s x . a 3.v x ] mtiene por lo menos el 88.89*/L (8/9), de los 
datos 

El intervalo [ x - 45 c , a + ] contiene por lo menos cl 93.759E (15/16), de 

los datos. 



EJEMPLO 3.5 

En cl mes de Enero el sueldo promedio de los trabajadores del sector industrial 
eia de $200. Para el mes de Julio se considera un aumento del 30 9r al sueldo del 
mes de Enero mas un adicional de $50 Si el coeficiente de variation en Enero era 
de 0.25, <>e puede decir que la distribucion de sueldos en Julio es mas homogenea* 

SOLUCION 

Sea X: Sueldos de Enero, V Sueldos de Julio 
La media de Enero es: x = $200. 

Coeficiente de variacion en Enero, CV = 0.25 

La desviacion estandar de Enero es s x = CV x x =0.25x200 = $50 

La relation entre las dos variables es: 

Y= 1.30X+50, 
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Entonces, la media de los sueldos de Julio es 

y = \3x + 50 = 1.3(200) + 50 = 3 10 
La varianza de los sueldos de Julio es 

4 =0-3 ) 2 s 2 x = (L3) 2 (50) 2 = 4225 

La desviacion estandar: s Y = V4225 = 65 

Coeficiente de variacion en Julio: CV = — = — — = 0.2097. 

y 310 

Comparando los coeficientes de variacion de Enero y Julio se puede decir que la 
distribution de los sueldos de Julio es mas homogenea. 

EJEMPLO 3.6 

Si el ingreso de 120 obreros tiene una media de $300 y una desviacion estandar 
de $30 

a) ^Cuantos obreros por lo menos tienen sueldos comprendidos en el intervalo 

[$240, $360]?. 

b) Determinar el intervalo que contiene al menos el 88.889% de los ingresos 

c) Si el mini mo sueldo es $210, en que porcentaje se puede afirmar que los 
ingresos son superiores a $390? 

SOLUCION. 

a) x = $300, s = $30, de la relation 

[300 -*(30), 300 + *(30)] = [240, 3601 
1 3 

resulta * = 2. Entonces el, 1 — = — o 75%(120)=90 obreros por los menos 

2 4 

tienen ingresos en el intervalo [240, 360]. 

b) Si al menos el 88.889% de los obreros tienen ingresos en el intervalo 

[300 -*(30), 300 +*(30)] 

entonces, 1 — ~ = 0.8889 . De donde resulta * = 3 . 
k 2 

Luego, el intervalo es [$210, $390]. 

c) Fuera del intervalo [$210, $390] esta menos del 11 11% de los ingresos. Si el 
mini mo es $210, entonces, el porcentaje de ingresos mayor que $390 es menos 
de 11.11%. 
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EJEMPLO 3.7 

El costo inicial de production, X ; de una muestra de 80 objetos de cierto tipo. 
tiene una desviacion estandar de $30. La media del costo de production es de $250 
para el 60% de la muestra y de $200 para el resto. El costo final de production Y 
es dado por la relacion: 



Y= 1.2X + 5. 

Si el precio de venta de cada objeto de la muestra es proporcional al cuadrado 
del costo final de production, ^cuanto se recaudaria por la venta total?. 

SOLUCION. 

= $30, jc =250x0.60 + 200x0.40 = $230 
De Y m 1 .2X + 5, se tiene, y = 1.2* + 5 = 1 .2(230) + 5 = 281. Tambien, 

4 =(1.2) 2 4 =(1 2) 2 (30) 2 = 1296 
80 

Recaudacion total = ^ yf = 8()(.v t 2 + y 1 ) = 80(1 296+(281) 2 ) = 6,420,560. 



3.3 Indices de asimetria 

Definition. Se dice que una distribution de frecuencias es simetrica , si los 
intervalos equidistantes del intervalo central tienen iguales frecuencias Tambien se 
dice que una distribution es simetrica si su curva de frecuencias es simetrica con 
respecto al centro de los datos. 

Dos distribuciones pueden tener la misma media y la misma desviacion estandar, 
pero pueden diferir en el grado de asimetria. 

Si la distribution es simetrica, entonces, la media, la mediana y la moda 
coinciden. En contraposition, si estos 3 promedios no coinciden la distribution 
tiene que ser asimetrica. 

Existen varias medidas de asimetria, una de ellas es el coeficiente o mdice de 
asimetria de Pearson . 

Definition. El indice de asimetria de Pearson es el numero 



Como en distribuciones asimetricas se verifica : x - Mo = 3(3c — Me), 

entonces, otra forma de expresar el indice de asimetria es: 
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3(jc - Me) 

&s = ■ 

Interpretation. 

Si la distribution de los datos es simetrica. As = 0. Ver la figura 3.1. a, donde 
se observa, ademas, que coinciden los tres promedios: x = Me - Mo . 

Si As * 0 , la distribution es asimetrica. Ademas, es asimetrica positiva o 
sesgada a la derecha, si As>0, (Fig. 3.1 b donde Mo < Me <x ). Y, es 
asimetrica negativa o sesgada a la izquierda si As < 0 (Fig. 3.1.C donde 
x < Me < Mo ) 



yiv 




/ \ \ 

/ 1 \ 

/ 1 \ 

/ \ i \ 

A i i \ 

1 i i \ 

>ii \ 


x — Me = Mo 


Mo < Me < x 


x < Me < Mo 


a) Sim6trica 


b) Asimetria positiva 

Figura. 3.1 


c) Asimetria negativa 



Por ejemplo, la distribution de los 45 ingresos quincenales del ejemplo 1.3 
tabulados en ocho intervalos tiene asimetria negativa: 



3(x - Me) 
As ~ 



s 



3(60.44-60.75) _ Q ^ 
11.079 



NOTA. (Otros indices de asimetria) 

El indice de asimetria de Pearson utilizando momentos es defimdo por: 

(« — l)(n-2)j 3 

n 

donde A7 3 = ^ (X f - - J) 3 , n — numero de casos, s — la desviacion estandar 

i=i 

Este fndice es utilizado por los paquetes de compute estadistico para determinar 

la asimetria de distribuciones de la forma dato-frecuentia. 

Para ti datos tabulados en k intervalos, un metodo alternativo es utilizar el 

indice de asimetria de Fisher definido por: 

. M i/ n 
As = — ^ — 



K 

donde: M 3 = /■ (m ( - jc) 3 , s = la desviacion estandar 



i=i 



www.FreeLibros.me 



Medidas de dispersion 



11 



Si la distribucion es simetrica As = 0 . Si As > 0, es asimetrica poskiva y si 
As < 0, es asimetrica negativa. 

Por ejemplo, continuando con el ejemplo 1.3, el fndice de asimetria de los 45 
ingresos quincenales tabulados en la forma dato-frecuencia es As =-0.375. Y de 
los mismos datos tabulados en 8 mtervalos es: As =-0.3. 

NOTA (Ojivas asimetricas y simetricas). Las ojivas o curvas de frecuencias acumuladas. 
presentan formas particulares segun el upo de asimetria. Por ejemplo, en la figura 3.2a la 
curva de freeuencia acumulada A es de una distribucion con asimetria extrema negativa. La 
Ojiva C es de asimetria extrema positiva. La ojiva B es de una distribucion simetrica. En ia 
figura .3.2b la diagonal B es la ojiva de una distribucion normal. La curva F es la ojiva de 
una distribucion simetrica leptocurtica, y la E de una platicurtica. (ver 3.4 curtosis) 





Fig. 3.2b Ojivas simetricas relativas 



3.4 Curtosis 

La curtosis es la propiedad de una distribucion de frecuencias por la cual se 
compara la dispersion de los datos observados cercanos al valor central con la 
dispersion de los datos cercanos a ambos extremos de la distribucion. La curtosis se 
mide en comparacion a la curva simetrica normal o mesocurtica (fig. 3.3a) 




Fig. 3.3 Curtosis de curvas simetricas 
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Una curva simetrica con curtosis mayor que de la normal es denominada curva 
leptocurtica (fig. 3.3c). 

Una curva simetrica con curtosis menor que de la normal es denominada curva 
platicurtica (fig. 3.3b). 

Existen varias mancras de medir la curtosis de la distribucion de los datos. 

Curtosis basado en percentiles 

Esta medida de curtosis es muy poco usada por ser muy inestable. Sin embargo, 
describe muy bien el concepto. 

En una curva normal, el cociente del rango intercuartil (percentil 75 menos el 
percentil 25) entre la diferencia del percentil 90 menos el percentil 10 es 
aproximadamente igual 0.5. A medida que Pj5 ^25 y ^90 o sean igualcs 
(valor del cociente casi uno), la distribucion sera leptocurtica, y a medida que 
P 75 — P 25 sea ca ^a vez mas pequeno con respecto a P 9 0 — P w (valor del cociente 
casi cero) la distribucion sera platicurtica. 

La curtosis utilizando percentiles se define por el cociente: 



^ _ Pj5~~P 25 



-0.5 



r 90 ‘ 



r lO 



Interpretation. Si la distribucion es normal. K tiende a 0. Si K tiende a 0.5, es 
leptocurtica, y si K tiende a -0.5, es platicurtica. 

Por ejemplo, la distribucion de los 45 ingresos quincenales del ejemplo 1 .3 
tabulados en 8 intervalos tiene curtosis K - (66.75 -~53.4)/(73.5- 45) -0.5 =-0.03. 

Sin embargo, no se puede relacionarla con una distribucion normal, por que esta 
distribucion de frecuencias no es simetrica. 



NOTA. (Otras medidas de curtosis) 

La curtosis utilizando momentos es definida por la expresion: 

K _ n{n + \)M : ,M .{n-X) 

(n-l)(n-2)(n-3)s 4 

n 

donde M } =^T(X ( -J) 7 , /i = numero de casos, s = la desviacion estandar. 

i=i 

Esta curtosis es utilizado por los paquetcs de computo estadfstico para 
determinar la curtosis de distribuciones de la forma dato-frecuencia. 

Para n datos tabulados en k intervalos. la curtosis se calcula por: 

K= M * ,n -5 
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k 

donde: M 4 = / f (ra- - 1) 4 , s = la desviacion estandar. 

r= 1 

Si la distribucion es normal A=0. Si K> 0, es leptocurtica. y si K < 0 es 

platicurtica. 

Por ejemplo. continuando con el ejemplo 1.3. la curtosis de los 45 ingresos 
quincenales tabulados en la forma dato-frecuencia es K = 1.021. Y de los mismos 
datos tabulados en 8 intervalos es K =0.244. Sin embargo, no se puede decir 
que es leptocurtica, por que la distribucion de los datos no es simetrica. 



3. 5 Diagramas de caja 

Existe Una gran variedad de graficas estadfsticas para extraer informacion 
acerca de las propiedades de un conjunto de datos. 

Una grafica util para reflejar propiedades de los datos es la grafica de caja 
(“box plots”) que se basa en la mediana (o en la media), los cuartiles y valorcs 
extremos. La caja representa el rango intercuartil que encierra el 50% de los valores 
y tiene la mediana {Me) dibujada dentro. El rango intercuartil tiene como extremos 
el percentil 75, P 15 (cuartil superior) y el percentil 25, P25 (cuartil inferior). 

Ademas de la caja se incluye la extension de los datos mcdiante segmentos que 
se extiendcn de la caja hacia el valor maximo (U) y hacia el valor nifnimo (L) de los 
datos. Este recuadro se dibuja con el eje de la variable en forma horizontal o 
vertical como se indica en la figura que sigue. 




Diagrama de Caja y Extensiones 



De un grafico de cajas, se obtiene informacion de los datos acerca de: 

La centralizacion (Observando la ubicacion de la mediana) 

La dispersion o variabilidad (mediante el rango intercuartil: RI ~ ^75 ~~ ^25 ) 
La asimetria (comparando: Me - P 2 s con P 15 - Me) 

Las colas (por la longitud de los segmentos que salen de los lados de la caja) 

EJEMPLO 3.8. 

En una prueba de conocimientos 20 alumnos han obtenido las notas: 
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1, 2, 3, 4, 5, 6, 7, 8,9, 10, 12, 13, 12, 13, 14, 15, 12, 13, 14, 15 
analizar los datos utilizando una grafica de caja. 

SOLUCION 

Se observa que la mediana es igual all. El percentil 75 es 13 y el percentil 25 
es 5.5. La extension superior es el dato maximo 15 y la extension inferior es el dato 
mfnimo 1. Ademas, la distribucion de los datos tiene asimetria negativa. 




Los datos atipicos o discordantes o raros llamados "outliers” (aislados) son 
aquellos que se ubican fuera del intervale [P 2 $ ~-L5tf/, *75 + 1 5RI ] , donde 
R1 — P 15 ~~ $25 es f an go intereuartil. En este caso, el extremo inferior L es el 
dato mini mo ruo outlier y el extremo superior U e$ el dato maximo no outlier. 

Existen muchos paquetes de computo que proporcionan las graficas de caja. 

EJERCICIO. 

Los ingresos quincenales en dolares de 40 familias se registraron de la siguiente 
manera: 

109 , 174 , 158 , 211 , 164 , 179 . 137 . 175 . 

192 , 147 , 203 , 186 , 072 , 246 , 193 , 163 , 

231 , 197 , 170 , 190 , 169 , 188 , 140 , 237 , 

179 , 085 , 217 . 168 . 185 , 208 , 164 , 175 , 

228 , 124 , 255 , 151 , 182 , 167 , 209 , 169 . 



analizar los datos utilizando un diagrama de caja. 

SOLUCION. 
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La medians Me =177. 

El percentil 75 es 200 y el percentil 25 es 163.5. Rango Intercuatril: d =36.5. 

P 15 + 1 . 5d = 200 + 1 .5x36.5 = 254.75. entonces. U = 246 (maximo no outlier). 

P 2 5 - 1.5*7 = 163.5 -1.5x36.5 = 108.9, entonces, L = 109 (minimo no outlier). 

Los outlieres (datos aislados) son: 255 en el lado superior y 72 , 85 en el lado 
inferior. La distribucion tiene asimetria positiva. 

Los diagramas de caja se usan tambien para comparar la variabilidad de dos o 
mas grupos de datos cuando estan expresados en la misma unidad de medida. 

Ademas se usan para comparar medias poblacionales. (Si dos cajas no se 
traslapan, entonces. la diferencia entre las medias es signifieativa. Ver referencia 
[15] pagina 336). 



EJERCICIOS 



1. A cuatro unidades estadisticas se le asigna los valores 6, 10, 14, y 20 
respectivamente en una escala de razon. Si en la misma escala se transforms 6 
en 9, calcular el coeficiente de variation de los 4 valores transformados. 

Rp. 7.758/18.75 = 0.41376. 

2. En una industria el jornal diario de sus obreros tiene una media de $10 y una 
desviacion estandar de $2. Si se hace un incremento de 20% en cada jornal y 
una bonification adicional de $3, ^en que porcentaje cambio la vanabiiidad de 
los jornales?. 

Rp. CVI= 0.2, CV2 = 0.16, bajd en 20%. 



3. La distribucion de las notas resultantes en un examen de conocimientos tiene 
media igual a 10, mediana igual a 8, moda igual a 4 y desviacion estandar igual 
a 3. Ademas, se sabe que el 25% de los alumnos tienen como maximo 02 y el 
75% de los alumnos tienen como maximo 1 1 

a) Describa y calcule la asimetria de la distribucion 

b) Determine la dispersion de la distribucion mediante el rango intercuartil 

c) Si a cada alumno se sube 4 puntos, ^se ha logrado bajar la dispersion de las 

notas? Rp. a) Cola derecha A s =3. b) RI=I 1-02=9, c) Si CV,=0.3, CV,=0.21 

4 . Se realizan 10 mediciones con cada uno de dos termometros A y B. Las medias 
aritmeticas de las medidas es 38 grados centigrados en cada caso y los 
coeficientes de variacion son 1% y 2% respectivamente, ^cual de los 
termometros es mas confiable?. 

Rp. CVA < CVB, entonces A es mis confiable 
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5 . La media y la desviacion estandar de los sueldos de N empleados de una fabrica 

son 500 y 30 respectivamente. A cada uno de los N empleados se les dara un 
aumento de A% de su sueldo mas una bonificacion de B soles. Halle A y B de tal 
manera que la media de los sueldos modificados sea 600 y su desviacion 
estandar 33. Rp. a = 0 . l , #=50. 

6 . Un investigador califica a dos grupos A y B que dan una prueba de aptitud, 
asignandoles valores en escala ordinal. Si el cuartil 1 de A es 5 y de B es 35 y si 
el cuartil 3 de A es 30 y el de B es 50, ^cual de los dos grupos tiene aptitud mas 
homogenea? 

Rp. usando el rango intercuartil, B es mas homogeneo. 

7 . Una prueba de conocimientos, A, se califico sobre 20 puntos dando una media 
de 12 y una desviacion estandar de 2 puntos. Mientras que una prueba de 
aptitud, B, se califico sobre 100 puntos, dando una media de 70 y una 
desviacion estandar de 5. 

a) ^En cual de las dos pruebas los puntajes son mas homogeneos? 

b) Si Juan tiene 14 en A y Luis 73 en B, ^quien tiene mejor rendimiento? 

Rp. a) B, C. V A = 0. 1 67, C. V B = 0.07 1 , b) Juan tiene mejor puntuacion estandar. 

8 . Los sueldos de 100 empleados de una empresa tienen una media de 300$ y una 
desviacion estandar de $50. Se proponen dos alternativas de aumento: i) $75 a 
cada uno, ii) 15% del sueldo mas $20 a cada uno. ^Cual alternativa es mas 
conveniente, 

a) Si la empresa dispone solo de $37,000 para pagar sueldos 7 . 

b) Si la empresa quiere homogeneizar los sueldos? 

Rp. a) total a pagar: i) 100x375=37,500, ii) 100x365=36,500. conviene ii) 
b) CV 1=50/375=0. 133, CV2=57.5/365=0.156. conviene i. 

9 . Los sueldos de 150 trabajadores de una empresa tienen un coeficiente de 
variacion del 5% en el mes de agosto. Para el mes de setiembre hay un aumento 
a cada trabajador del 20% de su sueldo mas una bonificacion de $60 y el 
coeficiente de variacion baja a 4%. 

a) Calcule la media y la desviacion estandar de ios sueldos del mes de agosto. 

b) ^Cuanto dinero adicional necesita la empresa para pagar todos los sueldos 
del mes de setiembre? 

Rp. a) x = 200, 5 = 10, b) 15.000. 

10 . La media del salario mensual que pagaba una empresa a sus empleados fue en 
junio de $300. En julio se incorporo un grupo de empleados igual al 20% de los 
que habian en junio y con un salario medio igual a $210. En agosto la empresa 
concedio un aumento general del 15% de los salarios mas $30. 

a) Calcule el salario medio de todos los empleados en el mes de agosto. 
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b) Si en julio el coeficiente de variacion fue 0.04, ^como ha variado este 
coeficiente en el mes de agosto con respecto a julio?. 

Rp. a) 357.75, b> 13.1 1/357.75=0.037, bajo. 

11. Al calcular la media y la desviacion estandar de 80 datos, resultaron 30 y 4 
respectivamente. Un chequeo mostro que en lugar del valor 1.7 se introdujo 17. 
Corrija la media y la desviacion estandar. 

Rp. x= 29.809. .y =4.885 



12. El costo C en dolares por operacion en una clinica depende del tiempo X, en 
horas, que esta dure, y es igual a: 

C = 50 + 100x + 250a 2 

Calcule el costo medio de 30 operaciones si tuvieron una media y una 
desviacion estandar igual a 2 horas. 

Rp. 50+1 00x2+250(2 2 +2 2 )=2250. 

13. La varianza de n, (n >4), datos de variable X es 40. Si la suma de los datos es 
40 y la suma de sus cuadrados es 560, calcular el coeficiente de variacion de los 
datos despues de la transformacion: Y - (3X + 9)/10 . 

Rp 11=10, Sx=40. X -4, y = 2.1, Sv =1.897, CV Y =1 897/2.1 =0.9 

14. El costo de produccion X de una muestra de cierto tipo de objeto tiene una 

desviacion estandar de $30. El costo medio de produccion es de $250 para el 
60% de la muestra y de $200 para el resto. Si su precio de venta en dolares es 
dado por la relacion Y — 1 . IX + 10, calcule la media y la varianza de la venta de 
la muestra. Rp. 263$ y 1089S 2 . 

15. El costo inicial de produccion, X, de una muestra de 50 objetos de cierto tipo, 
tiene una desviacion estandar de $3. La media del costo de produccion es de 
$25 para 30 de los objetos de la muestra y de $20 para el resto. El costo final de 
produccion Y es dado por la relacion: 

Y= 1.15X + 2. 

Suponga que el precio de venta de cada objeto de la muestra es proporcional al 
cuadrado del costo final de produccion, ^cuanto se recaudarfa por la venta total 
de los 50 objetos?. 

Rp. x =23, y =28.45, Sy =1 1 .9025, recaudacion=41 065.25. 



16. En una prueba de aptitud aplicada a 100 personas se obtuvo la siguiente 
informacion: Los puntajes se tabularon en una distribucion de frecuencias de 5 
intervalos de amplitud iguales, siendo el puntaje mfnimo. 40 y el maximo, 90. 
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La frecuencia absoluta del intervalo central fue de 40 y del quinto de 10. La 
frecuencia relativa del primer intervalo fue de 0.05 y la del cuarto de 0. 15. 

a) Calcule los cuartiles 1, 2, 3 y utilizando estas medidas analice la asimetria. 

b) Calcule la varianza si a cada persona se bonifica con 10 puntos. 

Rp. a) Qi =56.67, Q 2 =63.75, Q 3 =80. asim positiva, b) s 2 =I04 75, no cambia si se suma 10. 

17 . Los siguientes datos muestran los calificativos de 20 personas sometidos a una 
prueba de aptitud. Los 20 estudiantes fueron divididos en dos grupos, al grupol se 
calificd de 0 a 100 y al grupo 2 de 0 a 20: 

Grupo 1: 86, 81, 79, 73, 95, 86, 94, 90, 86, 88. 

Grupo 2: 16, 19, 13. 20, 14, 16, 19, 18, 17, 15. 

a) Calcule la media y la desviacion estdndar en cada grupo, ^cual de los grupos 
es m£s homog£neo?. 

b) iSg puede aceptar que el estudiante con 73 puntos del grupo 1 tiene mayor 
aptitud que el estudiante con 13 puntos del grupo 27. 

Rp. a) CVi=0.0744, CV2=0.1313, b) No, Zi=-2, Z 2 =- 1.67 el del segundo grupo est£ mejor. 

18 . Los sueldos en ddlares de los empleados de dos empresas A y B se dan en la 
siguiente tabla de frecuencias 



Sueldos 


[50, 90f 


[90, 130[ 


[130, 170[ 


[170,2101 


[210, 250] 


Empresa A 


12 


14 


16 


60 


20 


Empresa B 


30 


80 


15 


14 


13 



a) Calcule la asimetria de las distribuciones A y B. Grafique las ojivas 
relativas ^Es el rango intercuartil de A, menor al rango intercuatil de B7. 

b) ^En que empresa los sueldos son mas homogeneos? 

c) Si un empleado de A y otro de B ganan cada uno $ 1 30, ^quien de ellos esta 
mejor ubicado en su centro de trabajo? 

Rp. a) ASa=-0.813, R1 a = 6I .75, AS fi =-l 019. RI B =46.667, NO. b) En A. 

CVA=47 286/170.328=0.278, CVB =45.907/123.648=0.371, 
c) Z A = -0.853, Z B =0 1 376 el de A 

19 . Las notas de un examen se tabularon en una distribucion de frecuencias de 
cuatro intervalos de amphtud iguales a cuatro, siendo el cterto minimo igual a 
cuatro y las frecuencias relativas primera y tercera respectivamente 0.15 y 0.35. 
Calcule la varianza de la distribuci6n si la media aritmetica es 12.4. 

Rp 15.04 

20 . Los sueldos en ddlares de 50 empleados de una empresa se dan en la siguiente 
tabla: 



Sueldos 


[60, 100[ 


[100, 140[ 


[140, I80[ 


[180, 2201 


[220, 260] 


Empleados 


8 


10 


20 


7 


5 
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Se plantean dos alternativas de aumento: La primera, consiste en un aumento 
general de $50. La segunda consiste en un aumento general del 30% del sueldo, 
ademas una bonificacion de $10. 

a) i Cual de las dos propuestas conviene a los trabajadores si el interes es 

al) subir la media de los sueldos?, a2) bajar la dispersion de los sueldos?. 

b) [ ,Es la mttad inferior de los sueldos mas homogenea que la mitad superior? 

Rp al) medias. lera: S202.8, 2da: 208.04. conviene la 2da, a2) ,vi=46.434. .v. - 00 3642. 

CV 1=0.229. CV2=0.289. conviene la Ira. b) No. CVI=0.229, CV2=0.148 

21 Un conjunto habitacional esta formado por 3 edificios de departamentos Se 
tiene los siguientes datos respecto al consumo mensual de electricidad de cada 
uno de los edificios. 

Edificio 1 Tiene 8 departamentos, la media y la desviacion estandar de los 
consumos es S /. 85 y S/. 12 respectivamente. 

Edificio 2: Tiene 9 departamentos cuyos consumos en soles son: 88, 92, 106, 
110, 93, 102, 9L 94, 80. 

Edificio 3: Los consumos se dan en la siguiente tabla: 



Consumo en soles 


Departamentos 


[50. 60 [ 


1 


[60, 70[ 


2 


[70, 80[ 


4 


[80, 901 


3 



a) ^Cual de los edificios tiene el menor consumo de electricidad? 

b) ^Cual es el consumo promedio en todo el conjunto habitacional? 

c) [,En cual de los edificios los valores que representan los consumos estan mas 

dispersos?. Rp a) Edif 1: con S/.680. b) S/. 84.296, c) en Edifi 1, CV1=0.14 

22. En una empresa el coeficiente de variacion de los ingresos de 150 empleados 
es 69%. Despues de un aumento de los sueldos en S/ 85 a cada uno de ellos, el 
coeficiente de variacion resulto 54%. La empresa fija un salario mini mo de S/ 
350 lo que beneficia a 50 empleados que antes del reajuste ganaban menos de 
S/280 con un sueldo promedio de S/ 250. ^Que cantidad de dinero necesita 
mensualmente la empresa para pagar los sueldos despues del reajuste?. 

Rp. Antes del reajuste la media de los 150 es S/ 306, de los 50 es S/.250, y de los 100 es S/ 
334. Despues del reajuste la media de los 50 es realmenle $335 pero sube a S/.350 y de los 
100 es S/ 419. Se necesita: 50 x 350 + 100 x 419 = 59,400 S/_. 



23. En una empresa donde trabajan hombres y mujeres la media general de los 
sueldos es $250. Si la media y la desviacion estandar de los sueldos en el grupo 
de varones es $270 y $15 y en el grupo de mujeres es $220 y $ 10, 

a) Calcule el porcentaje de hombres y mujeres, 

b) Calcule la desviacion estandar de los sueldos de todos los trabajadores de la 

empresa. Rp. a) 60% hombres. 40% mujeres, b) $27.84. 
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24 . Las calificaciones de 120 personas que rinden una prueba de aptitud divididos 

en dos grupos A y B tienen una media total de 208 y una varianza de 1728.6. La 
media y la varianza de las calificaciones del grupo A es 240 y 225 
respectivamente. Si 72 de tales personas forman el grupo A, calcule la media y 
la varianza de las calificaciones del grupo B Rp. 160, 144 

25 . Un producto que proviene de dos fabricas A y B se clasifica en tres clases segun 
su duracion: De lera, si su vida util esta en el cuarto superior, de 3era, si su 
duracion esta en el cuarto inferior, en otro caso son de 2da clase. Los precios 
son los mismos en cada marca A y B y en cada clase. Si A y B tienen medias 
iguales a 12 meses. ler cuartil 10 y 8 meses, y si sus curvas de frecuencias son 
simetricas leptocurtica y platicurtica respectivamente. ^cual seria su estrategia 
de compra para adquirir las 3 clases del producto?. 

Rp. lera de B, 3era de A y 2da dc A por tener menor rango intercuartil. 

26 . Los precios de un producto en las 50 tiendas del centro de una ciudad A varian 
entre 8 y 18 soles. Estos precios se han organizado cn una distribucion de 
frecuencias con 5 intervalos de amplitud iguales, resultando que en el 16, 56, 76 
y 90 por ciento de estas tiendas los precios fucron inferiores a 10, 12, 14, y 16 
soles, respectivamente. Un estudio similar mostro que en las tiendas del centro 
de otra ciudad B, la media de los precios del mismo producto resulto ser 13.5 
soles con una desviacion estandar de 3 soles. Una tienda, que tiene sucursales 
en los centros de las ciudades A y B, vende el producto en la ciudad B a 12 
soles. Si esta tienda, tiende a fijar sus precios de acucrdo al medio, estime el 
precio al que vende este producto en la ciudad A. 

Rp. A=2. free: 8, 20, 10. 7. 5. media =12.24. s=2.3963. Z en B es -0.5 y Z en A es 
(.v-1 2.24 )/2. 3963. haciendo iguales resulta;c=l 1.04 

27 . ( Desigualdad de Chebyshev). 

Si I y s son la media y la desviacion estandar dc n datos. pruebe que el 
intervalo: [x — ks.x + ks] , k> 1 contiene al menos el (1 — 1 /A: 2 )x 1 00% . de los n 
datos. Esto es, el numero de datos de cualquier tipo de distribucion que caen 
en tal intervalo no puede ser menor a (l-l//r)xl00%. 

SOLUCION. Sean ri] y «2 # de datos dentro y fuera respectivamente del intervalo, entonces. 
(/?i+/i 2 )//i=l . Por otra pane, la suma de cuadrados total es igual a la suma de cuadrados dentro 
mas suma de cuadrados fuera. Luego, 

t 2 In (A > - ? > 2 - J)2 ~ > 

n n n 

Si los datos x i est&n fuera del intervalo, entonces, |jr # — A'j > ks . y. 

SCF = X„ 1 (X i -x) 2 >Z n J 2 -' 2 =* 2 S 2 » 2 

Sustituyendo, este ultimo en s 2 . resulta, k 2 s 2 n 2 >/is 2 . Luego, la proporcibn de datos fuera 
del intervalo n^n-X es menor que 1 Ik 2 , y la proporcion de datos dentro es al menos 1 — 1 Ik 1 
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28 . Los tiempos que emplearon 900 personas para hacer una tarea tienen una media 
de 30 minutos y una desviacion estandar de 3 minutos. 

a) ^Cuantas de estas personas por lo menos, emplearon entre 24 y 36 minutos 
para hacer esa tarea? 

b) Determine un intervalo mas corto en el que se encuentren los tiempos 
empleados por al menos 800 de estas personas. 

c) Si la distribution de los tiempos empleados es simetrica, /,qud porcentaje 
de estas personas emplearon mas de 39 minutos?. 

Rp. a) *=2, al menos 675 b)l-* 2 =8/9. k= 3, [21, 39]. c) menos de 1/18 o 5.55%. 

29 . Los puntajes obtenidos en una prueba de conocimientos tienen una meda igual a 
8. Si el coeficiente de variacion de los puntajes es igual 0.25 

a) Halle el porcentaje de evaluados cuyos puntajes esten comprendidos en el 
intervalo [04, 12]. 

b) Si el puntaje minimo es igual a 02, <,que proportion de los evaluados tienen 
mas de 14?. 

Rp. s= 3, a) K=2, al menos 75%, b) K=3, al menos 88.89% en (2 .14], menos de 11.11%. 



30 . Pruebe que si jq, jc 2 ,...jc„ tienen media x y desviacion estandar s , entonces, 

— — — — — — tiene media cero y desviacion estandar 1 . 

s s 

31 . Verificar que si dos series de datos tienen respectivamentc tamanos: n } ,n 2 , 

medias 3q,Jc 2 y varianzas: entonces, la varianza (total) de las dos series 

en conjunto esta dad a por: 

(nrf+n 2 sl) + -?^(x x -j 2 ) 2 

c 2 _ ” l +”2 

Sj — 

ft, +ft 2 

32 . La tabla que se presenta a continuation corresponde a un numero de personas 
que se encontro en una muestra tomada en 4 distritos y que son consumidores de 
un producto. La tabla muestra la clasificacion por distnto y por edad y sexo: 



Distnto 


Edad Hombres 


Edad Mujeres 


20-30 


30-40 


4^ 

0 

1 

o 


20-30 


30-40 


40-50 


Lince 


15 


45 


32 


22 


18 


60 


Lima 


50 


32 


28 


35 


44 


22 


Pueblo libre 


15 


36 


45 


32 


60 


18 


Surco 


40 


24 


14 


46 


45 


24 



a) Compare la vanabilidad de las edades de los hombres y mujeres de Lince. 

b) Compare la vanabilidad de las edades en Lince y Pueblo Libre 
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c) Compare la variabilidad de las edades de hombrcs y mujeres de la muestra. 

d) Halle la varianza de las edades de toda la muestra. 

Rp. a) CVH=0. 1 87, CVM=0.212, b) CVL=0.235, CVPL=0.203. 

c) CVH=0.228, CVM=0.224, d) 62.072 



33. Las notas finales del curso de Estadistica que varian de cero a veinte, se 
tabularon en una distribucion de frecuencias de 5 intervalos de igual amplitud. 
La ojiva de frecuencias relativas resultante corresponde al grafico de la funcion: 



0.025.x: 


0<*<4 


0.0375* — 0.05 


4 < * < 8 


0.05* -0.1 5 


8<*< 12 


0.075* -0.45 


12 < * < 16 


0.0625* -0.25 


1 6 < * < 20 



H(x) = 



Calcule la media, la mediana y la desviacion estandar de las notas 

Rp. free. 0.10, 0.15, 0.20, 0.30, 0.25, Media=l 1.8, Me= 12.667,, Desv.estd=5. 134. 



34. Un gerente de ventas de una empresa ha registrado los siguientes montos de 
ventas de al menos S/. 100 en un determinado dia. 

139, 222, 261, 209, 258, 204, 177, 227, 115. 

154, 188, 233, 200, 247, 285, 241, 216, 220. 

198, 181, 194, 102, 199, 215, 212, 209, 276. 

218, 238, 197, 167, 223, 170, 194, 239, 205. 

193, 267, 205, 199, 400, 300, 100, 102, 270. 

Haga el analisis descriptivo de los datos utilizando diagrama de caja. 

Rp. Min=l 00, Max=400, Medii*=210 4, s=54.6, Qi=193, Me=209, Qh=238 . RI=45. Min No 
Out=130. Max No Out=300, datos aislados 400 (superior) y 100, 102 (inferior). 



35. En una prueba de aptitud un investigador asigna a dos grupos de personas los 
siguientes “valores”. 

Gmpo 1: 86, 89, 74. 73, 95, 86, 94, 90, 86, 88, 74. 76. 75, 93, 92 
Gmpo 2: 88, 95, 60. 100, 76, 93, 90, 98, 92, 75, 65, 68, 70, 73, 94. 

Utilizando un diagrama de caja, compare la variabilidad y la asimetrfa de los 
dos grupos foCuaJ de los dos es mas asimetrica?) 

a) Si los “valores” est£n en escala de intervalos 

b) Si los “valores” estan en escala de orden 

Rp. a) Grupol Q,=75, Me=86. Q,=92 , Rl=17, Min=73, Max=95, Grupo2: Q,=70, Me=88, 
Qs=94 . Rl=24, Min=60, Max=100, Grupo2, es mds disperso, ambos tienen asimetria 
negativa, En 1 , 1 1/6=1 .83 y en 2 18/6=3, luego 2 es mds asimetrica, b) idem 
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REGRESION LINEAL SIMPLE 



4.1 Introduction 



En este capitulo, trataremos con muestras bivariantes cuantitativas, es dear con 
muestras donde en cada unidad estadistica se observan dos caracterfsticas 
cuantitativas medibles X e Y\ por ejemplo, ingresos y gastos mensuales. El objetivo 
es estudiar la asociacion entre dos variables conocida tambien como asociacion 
simple. 

La primera forma del estudio de la asociacidn entre las variables X e Y es la 
regresion, que consiste en determinar una relacion funcional (recta de regresion) 
entre ellas, con el fin de que se pueda predecir el valor de una variable en base a la 
otra. La variable que se va predecir se denomina variable dependiente y la variable 
que es la base de la prediccion se denomina variable independiente. 

La segunda forma del estudio de la asociacion entre las variables X e L, es 
denominada correlacion, que consiste en determinar la variacion conjunta de las 
dos variables, su grado de relacion, y su sentido (positivo o negativo). La medida 
del grado de relacion se denomina coeficiente o indice de correlacion. El cuadrado 
del indice de correlacion se denomina coeficiente de determinacion. 

En este capitulo haremos un estudio descriptivo de las regresion lineal en el 
sentido que, la ecuacion de regresion lineal que se determina sera valida, si hay la 
seguridad de que existe un alto grado de correlacion entre las variables indicado 
por el coeficiente de determinacion. 

Un estudio mas avanzado de este tema se expone en el capitulo 13 del libro 
Estadistica Inferencial: Aplicaciones, que viene a ser la segunda parte de este texto. 

El lector deberfa correr paquetes de computo entre otros el MCEST para las 
aplicaciones de este capitulo. 
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4.1.1. Diagrama de dispersion 

Sean ),(x 2 * Yi )>•••> (x„ » Y n ) n va l° res de la variable bidimensional 

(X,E), observados en una muestra, donde los x i son los valores de la variable 
X y los y i son los valores de la variable Y. 

Los metodos estadisticos descriptivos son validos en cada variable, es decir eada 
variable tiene media, desviacion estandar, etc. Lo nuevo aqui es que con estos dalos 
en pareja se puede medir la dispersion conjunta con respecto a las medias (x, v) 
mediante la covarianza. 

Ademas, si los dates de X se tabulan en r intervales; /• ; y los datos de Y sc 
tabulan en s intervalos; I ' , se tendra una distribution conjunta de frecuencias que 
consiste de los intervalos (/, ,/' ) , y frecuencias . En este texto solo haremos 
regresidn con datos tabulados, pero no en intervalos. 

Deflnicion. Se denomina diagrama de dispersion o nube de puntos, a la graflca 
de los valores (x t , y, ) de las variables X e Y en el sistema cartesiano. 

Es frecuentemente posible visualizar el tipo de relacion existente entre dos 
variables a partir del diagrama de dispersidn. 



Y 



Y 



Y 



Y 



a) lineal positiva 



X 



X 



-X 



b) lineal negativa c) no lineal d) ninguna relacion 
Fig. 4.1. Diagramas de dispersion 






Por ejemplo, en la figuras 4.1 a),b) los datos visualizan una relation lineal entre 
las variables X e Y. En la figura 4.1 c) los datos visualizan una relacion, pero, una 
relation no lineal , y en la figura 4. 1 d) los datos visualizan ninguna relacion valida 
en regresion entre las variables X e Y. 



En este capftulo como ya se indicado en la introuccion, haremos regresion 
lineal descriptiva determinando la ecuacion lineal de regresion 



Y = a + bX 
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que rnejor se ajusta a los n pares de datos y analizando la validez de la 

regresion a partir del coeficiente de determination. 

4.1.2 Covarianza 

La covarianza es una estadistica que mide el grado de dispersion o variabilidad 
conjunta de dos variables X c Y con respecto a sus medias respectivas(3c, y) . 

Definition. La covarianza de n valores (x x , y ] ).(* 2 , ;y 2 X- *i(* n » y n ) de una 
variable bidimensional ( X ,Y) es el numero Cov(X, Y) o que se define igual a 
la media aritmetica de los productos de las desviaciones de los datos con respecto a 
sus correspondientes medias (jc, y ) . Esto es, 

n 

-y) 

„ i=l 



En el numerador de s XY se verifica la relacion: 

n r\ 

-x)(y i -y) = Y d X i y i -nxy 

i= 1 i=l 

Luego, s xr =— xy . 

n 

La covarianza a diferencia de la varianza, puede ser negativa 



4,1.3 Coeficiente o indice de correlacion 

Definition. El coeficiente de correlacion lineal de Pearson de n pares de valores 
( x \y Y\ )» (^2*^2 )’••*’ ^ x n^y n ) de una variable bidimensional (X,L). es el 
numero abstracto r que se calcula por 



s x s Y 

donde, s XY es la covarianza de X e Y 

s x es la desviacion estandar de X 
es la desviacion estandar de Y 



www.FreeLibros.me 



90 



Esiadistica 



El lector deberfa verificar que 

__ 

Verificaremos (seccion 4.2.3) que el coeficiente de correlacion r es un numero 
comprendido entre -1 y +1, esto es: 

— 1 < r < 1 . 

Interpretation: 

Si r = 1 , se dice que hay una correlacion perfecta positiva. 

Si r = — 1, se dice que hay una correlacion perfecta negativa. 

Si r = 0, se dice que no hay correlacion entre las dos variables 



4.2 Regresion lineal simple. 

Dados n pares de valores (jc, , y { ),(* 2 , >2 )*•••* ( x n » Yn ) de una variable 
bidimensional (X,F). La regresion lineal simple de Y con respecto a X , consiste en 
determinar la ecuacion de la recta: 

Y = a + bX 

que mejor se ajuste a los valores de la muestra, con el fin de poder predecir o 
estimar Y (variable dependiente) a partir de X (variable independiente). 

El proceso de predecir o estimar Y a partir de la variable X, es la regresion. 
Hallar la funcion lineal Y = a + bX , consiste en determinar los valores de a y b a 
partir de los datos de la muestra. 

Usaremos la notacion y* para representar un valor de Y calculado de la 
ecuacion Y = a + bX cuando X es igual a x t . Esto es, = a +bx l 

A1 valor se denomina valor estimado o predecido o ajustado de Y cuando 

Si x i es un valor de la muestra. entonces ( x i , y i ) es un punto de la recta de 
regresion Y = a + bX , (Fig. 4.2). 
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Fig. 4.2. Desviaciones de valores observados y ajustados 



Definition. Se denomina error o residuo a cada diferencia, 

d i = y, - 9i 

del valor observado v 4 y el valor pronosticado y, (Fig 4.2). 

Un metodo para determinar la recta que mejor se ajuste a los n dates de la 
muestra (x i9 y,) es el metodo de minimos cucidrados , que se explica a 
continuacion. 



4.2.1 Recta de regresion de minimos cuadrados. 

La recta de regresion de minimos cuadrados de Y en X es aquella que hace 
minima la suma de los cuadrados de errores ( SCE) cuya expresion es: 

SCE^Y^df =Y(y> -y>) 2 =X(y. -a-bx,) 2 

1=1 1=1 r=l 

Luego, determinar una recta de regresion de minimos cuadrados consiste en 
hallar los valores de a y b de manera que hagan minima, la suma: 

n 

SCE = ^[y, - (a + bx, )] 2 
1 =] 

Este requisito se cumple, de acuerdo con el teorema de Gass-Markow, si a y b 
se determinan resol viendo el siguiente sistema de ecuaciones normales : 

n n 

Yy t =na + bYx, 

1=1 1=1 
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n 



n 



n 



=a Ts x ‘ +b lL x ‘ 



i=l 



i=] 



i=l 



Estas ecuaciones se obtienen de igualar a cero las derivadas de SCE con 
respecto any con respecto a b respectivamente consideradas como variables, ya 
que ( x t , y t ) son datos observados. 

Resol viendo el sistema de ecuaciones normales para b, se obtiene: 



que es otra forma de expresar la recta de regresion. Observar que la recta de 
regresion contiene al punto (T,y) cuyas componentes son las medias de X y de Y 
respectivamente. 

Interpretation del coeficiente de regresion b 

El coeficiente b es la pendiente o el coeficiente de la regresion lineal. La 
constante a es la ordenada en el origen. 

Si b > 0, entonces, la tendencia lineal es creciente, es decir, a mayores valores de 
X corresponden mayores valores de Y. Tambien, a menores valores de X 
corresponden menores valores de Y. 

Si b < 0, entonces, la tendencia lineal es decreciente, es decir, a mayores valores 
de X corresponden menores valores de Y. Tambien, a menores valores de X 
corresponden mayores valores de Y. 

Si b = 0, entonces, Y — a. Luego, Y permanece estacionario para cualquier valor 
de X. En este caso se dice que, no hay regresion. 

NOTA. b tambien se interprets es el cambio promedio en Y = a + bX cuando X 
cambia una unidad. Esto es, si x i se incrementa 1, entonces y t se incrementa en 
promedio b. 




y dividiendo por n la primera ecuacion normal, se tiene: el valor: 

a — y —bx 



NOTA. Sustituyendo a = y — bx en Y = a + bX , resulta, 

Y -y=b(X -x) 
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En general, si JC f se incrementa k , entonces y t se incrementa en promedio kb 
(verificar!). 



EJEMPLO 4.1. 

En un estudio de la relacion entre la publicidad por radio y las ventas de un 
producto, durante 10 semanas se han recopilado los tiempos de duration en 
minutos de la publicidad por semana ( X ), y el numero de artfculos vendidos (Y) y 
resultando: 



Semana 


1 


2 


3 


4 


5 


6 


7 


8 


9 


10 


Publicidad X 


20 


30 


30 


40 


50 


60 


60 


60 


70 


80 


Ventas Y 


50 


73 


69 


87 


108 


128 


135 


132 


148 


170 



a) Trazar el diagrama de dispersion, e indicar la tendencia. 

b) Calcular la recta de regresion de minimos cuadrados con el fin de predecir las 
ventas. 

c) Estimar la venta si en una semana se hacen 100 minutos de propaganda. 

d) Calcular el coeficiente de correlation. 

e) Si en la novena semana se incrementara la publicidad en 5 minutos, ^en cuanto se 

estima se incrementen las ventas?. 

SOLUCION. 

a) A1 trazar el diagrama de dispersion (fig. 4.3) vemos que hay una relacion lineal 
positiva entre el numero de artfculos vendidos y el tiempo de publicidad 
semanal por radio. 
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b) Para determinar la recta de regresion de mfnimos cuadrados a partir de los datos. 
es decir para calcular a y b se dispone del cuadro 4 . 1 . 

De donde se obtiene: 

ti — 10 , IX =500, ZF = 1100, ZXF =61800 
ZX 2 =28400, ZK 2 = 134660 
_ 1100 



- 500 ™ 
x = = 50, 



= 110 



10 10 

Cuadro 4.1 . Computo de los coeficientes de regres ion 



X 


Y 


XY 


X 2 


Y 2 


20 


50 


1000 


400 


2500 


30 


73 


2190 


900 


5329 


30 


69 


2070 


900 


4761 


40 


87 


3480 


1600 


7569 


50 


108 


5400 


2500 


11664 


60 


128 


7680 


3600 


16384 


60 


135 


8100 


3600 


18225 


60 


132 


7920 


3600 


17424 


70 


148 


10360 


4900 


21904 


80 


170 


13600 


6400 


28900 


500 


1100 


61800 


28400 


134660 



Una forma de calcular b es: 

, «zxy-zxzy 1 0x 6 1 800- 500 x 1 100 68000 „ 

b = = : — = — 2 



«ZX 2 -(ZX) 2 10x28400- (500)' 

La otra forma del calculo de b es: 

s XY = ^^ -Iy = -^^-50x 110 = 680 



34000 



n 



s v = 



2 > : 



-s ! = 



10 

28400 

10 



50 z = 340, 



2 



680 

340 



= 2 . 



Ademas, 



a = y~bx - l 10-2(50) = 10. 
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La recta de regresion es: Y = 10 + 2 X . 

NOTA. Utilizando Y - y = b( X — x ) , se tiene: 

K-110 = 2(X -50) o Y = 10 + 2X 



c) Si jc f =100, v = 10 + 2(100) = 210 . No tenemos por el momento un criterio 
para concluir que este pronostico es confiable. 

d) El coeficiente de correlacion 



s xy _ 680 

S x S y 18.439x36.959 



0.9978 



es altamente positivo. Es un primer criterio para analizar la validez de la 
prediccion 

e) Si en la no vena semana se incrementara el tiempo de propaganda en 5 minutos, 
entonces, la venta se incrementa en promedio 5x2=10 unidades.. 



EJEMPLO 4.2 

Los ingresos (X) y los gastos (Y) mensuales en dolares de una muestra de 100 
familias han dado los siguientes resultados 

3c = 210, > = 200, s 2 x =5.76, s 2 =2.56, Z XY =4200364.8 

Determine la recta de regresion de mmimos cuadrados de Y en X y estime el gasto 
de una familia que tiene $250 de ingreso. 

SOLUCION. 

v y XY 4200364.8 

a) c = ^ xy = - -210x 200 = 3.648 

n 100 

La recta de regresion de minimos cuadrados de Y en X es 

Y-y = ^f(X-x), 

S X 

y - 200 = 3 648 ( X - 210 ) - 
5.76 

Y = 67 + 0.633 X 

b) Si una familia tiene un ingreso de $250 entonces su gasto estimado serfa 
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y = 67 + 0.633 x 250 =225.25. 



NOTAS: 

1) De b = s XY /sl < y r ~ S XY / S X S Y > se °btiene la relacion entre los 
coeficientes de correlacion r, y el de regresion; b\ 



b = r 



S Y 

S X 



Entre otras cosas, r y b tienen el mismo signo. 



2) La recta de regresion de X en L, es decir X variable dependiente de Y esta dada 
por: 

X =c+dY 



donde, d — y c = x — dy 

Sy 

Esta recta de regresion de X en Y se puede escribir tambien como: 

X-x =d(Y-y)o Y-y= l (X-x) 

d 

Observar que tambien pasa por el punto (x,y) 

3) Los coeficientes de regresion by d verifican: 

_ S XY S XY _ S XY S XY _ rr __ r 2 
S x Sy S x Sy S x Sy 

2 • + 

El numero r es denominado coeficiente de determinacion. 

4) Comparando las rectas de regresion: 

L x : Y~y = b(X - x) deLenX 

L 2 : Y-y= 1 (X -x) de X eny 
d 

resulta que, son coincidentes si fcd = l,osir 2 =l. 
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Por otra .parte, r - 0, significa que L, (o L 2 ) es paralela al eje X, L 2 (o 
Lj ) es paralela al eje Y y perpendiculares entre si en el punto comun ( x. y ) . 
En consecuencia, si r tiende a cero, las rectas L, y L 2 tienden a ser 

perpendiculares y si r tiende a 1 o a -1, las rectas L, y I 2 tienden a ser 
coincidentes. 



4.2.2 Particion de la varianza de Y , s 2 y 

Sea (Xj,yj) un valor observado de la variable (X,K) e y t el valor en la 
ecuacion de regresion Y = a + bX cuando X — x i 
La varianza de Y es el numero: 

Tiy.-y ) 2 

2 _ i = l 




Observar que en la figura 4.4 se tiene: 

y, -y = (y, -y, ) + (y, -y) 

Error total = Error no Explicado + Error explicado por la regresion. 

Esta terminologia surge, debido a que las desviaciones y t - y, con respecto a 
la recta de regresion, se comportan de una manera aleatoria o impredecible, debido 
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a que y i es aleatoric. En tanto que las desviaciones >7 ~y de la recta de regresion 
con respecto al eje de las X se explican por la recta de regresion de Y en X , ya que 
solo depende de los y s que estan sobre la recta. 

Por otro lado se verifica la siguiente particion de sumas de cuadrados: 

£(y,- - y) 2 = Xcv,- ~ y > )2 + 1L& ~ y )2 

i - 1 i=l 1=1 

SCT = SCE + SCR 

En esta particion de las sumas, la primera suma se denomina surna de 
cuadrados total (SCT), refleja la variacion de los valores dc Y con respecto a la 
media y . 

La segunda suma se denomina, suma de cuadrados de los errores (SCE), y la 
tercera suma se denomina suma de cuadrados debido a la regresion (SCR), refleja 
la cantidad de variacion de los valores de Y explicada por la recta de regresion. 

Si se divide por n , (el tamano de la muestra), entonces, se dice que la “ varianza 
de los y i es igual a la varianza no explicada o residual mas la varianza explicada 
por la recta de regresion ' 

EJEMPLO 4.3. 

En una muestra de 5 obreros de una fabrica se ban observado sus anos dc 
experiencia (X) y el tiempo que tardan en realizar una determinada tarea (>0. Los 
datos se muestran en la tabla que sigue: 



X 


1 


2 


3 


4 


5 


Y 


8 


9 


4 


3 


3 



Verificar que la variacion total es igual a la variacion no explicada mas la variacion 
explicada por la regresion de Y en X. 

SOLUCION. 

De los datos de la muestra se obtiene la siguiente ecuacion lineal de regresion 
por minimos cuadrados. 



K = 10.2-1.6X donde y=5.4 
Cuadro 4.2 



yt 


y, 


y-t-y 


yt - y, 


y, - v 


(y,-y) 2 


<N 

1 

■w 


(y,-y) 2 


8 


8.6 


+2.6 


-0.6 


+3.2 


6.76 


0.36 


10.24 


9 


7.0 


+3.6 


+2.0 


+ 1.6 


12.96 


4.00 


2.56 


4 


5.4 


-1.4 


-1.4 


0.0 


1.96 


1.96 


0.00 


3 


3.8 


-2.4 


-0.8 


-1.6 


5.76 


0.64 


2.56 


3 


2.2 


-2.4 


+0.8 


-3.2 


5.76 


0.64 


10.24 


27 




0.0 


0.0 


0.0 


33.20 


7.60 


25.60 



www.FreeLibros.me 



Regresion lineal simple 



99 



Del cuadro 4.2, resulta 

So - y ) 2 = So. ~ y > )2 + So, - >) 2 

1=1 <=i <=i 

33.20 =7.60 + 25.60. 

NOTA. Para comparar estas varianzas se convierten a varianza relativas, 
dividiendo la identidad entre 33.20 (SCT). 

33.20 _ 7.60 25.60 

33.20 ~ 33.20 33.20 

1 = 0.23 + 0.77 



La lectura es como sigue: 

El 100% de la varianza total se particiona en 23% de varianza no explicada 
mas 77 % de varianza explicada por la regresion de Y en X . 



4.2.3 Coeficiente de determinacion 

2 SCR 

El coeficiente de determinacion r se define como el cociente: 

SCT 

Esto es,. el coeficiente de determinacion r de la regresion de Y en X , esta 
dada por la expresion: 

,_SCK 



r = 



SCT 



So, - y ) 2 

1=1 

De la particion de suma de cuadrados, SCT = SCE + SCR , resulta: 



- SCE 2 

1 — + r~ 

SCT 



(*) 



Por lo tanto para interpretar la particion de varianzas relativas bastara con 



calcular r , luego, r 2 y establecer: 



1 = (1 — r 2 ) + r 2 
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para concluir que el 100% de la varianza total es igual (1 — r 2 )xl00% de 

varianza no explicada mas r x 1 00% de la variacion explicada por la recta 
de regresion. 

Por ejemplo, en el ejemplo 4.2, r = 0.95, r 2 =0.9025, entonces, se tiene: 

I =(1 - r 2 ) + r 2 

1= 0.0975 + 0.9025 o aproximando a dos decimales 1=0 10 + 0.90 

Es decir, el 90% de la variabilidad en los gastos mensuales se explica por la 
asociacion con los ingresos mensuales. Quedan 10% de variabilidad en los gastos 
que no se explica por la regresion. 

Consecuencias. 

1) De la identidad (*) se concluye que 0 < r 1 < 1 . Entonces, — 1 < r < 1 . 

Si r > 0, se dice que existe una correlacion directa positiva , ambas variables 
aumentan (o disminuyen) simultaneamente. 

Si r<0, se dice que existe una correlacion inversa negativa , mientras los 
valores de una variable aumenta, los de la otra disminuyen y viceversa. 

Si r — 0 , se dice que no hay correlacion entrc X e Y . Por lo tanto no hay 
regresion de V en X. 

2) r 2 = 1 , solo si, SCE = 0 , o solo si, y i = y t para los n datos de la muestra. 
Esto significa que todos los y, estan en la recta de regresion. En este caso se 
dice que hay una correlacion perfecta entre X e Y. 

Si r = 1 , se dice que hay una correlacion perfecta positiva. 

Si r = — 1, se dice que hay una correlacion perfecta negativa. 

3) r =0, solo si, SCR - 0 , o solo si, v | = y para los n datos de la muestra, 

Es decir y i no cambia cuando cambia x i , o todas las predicciones son iguales 
a una misma constante. En este caso no hay correlacion ni regresion. 

4) El coeficiente de determinacion r 2 , es pues una medida de la proximidad del 

ajuste de la recta de regresion. Cuanto mayor sea el valor de r f mejor sera el 
ajuste' y mas util la recta de regresion como instrumento de predict ion. 

( r 2 = 0.90 indica que de 100 pares de puntos 90 estan en la recta de regresion y 
10 fuera de la recta de regresion) 

NOTA. (Una advertencia) 

El haber supuesto una funcion lineal entre dos variables y haber encontrado un 
alto coeficiente de correlacion, no necesariamente significa que una variable 
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dependa de la otra, pues f csta correlacion puede no ser causal si no casual Para 
que exista correlacion debe haber causa y efecto. 



4.2.4 Invarianza del coeficiente de regresion y del indice 
de correlacion 

Hay dos formas de simplificar los calculos de la pendiente b de la regresion y del 
coeficiente de correlacion r. La primera forma es mediante un cambio de origen , 
que consiste en transformar los datos de X o Y o de ambos a la forma X' — X — h , 
Y'=Y — k con h y k constantes. 

Si se hacen tales transformaciones en X o Y o en ambos, b y r no cambian, esto 
es: 

r _ S XY _ S X’Y' __ S X'Y _ S XY’ 

° 2 2 2 2 
S X S X' S X' s x 

r _ S XY _ S X Y’ S X'Y _ S XY‘ 

S x Sy S X ‘Sy s x Sy S x S r 

La segunda forma de simplificar el calculo de b y de r, es mediante una 
reduccion de la escala , que consiste en dividir X e Y por una constante diferente de 

cero. 

Si X'= X/h e Y'—Y/h y entonces, la pendiente b no cambia, esto es. 



U — S XY _ S X'Y' 

**2 2 
s x s x > 

Si se hace la transformacion X'= X/h, Y'—Yjk , en X o Y o en ambos 
entonces, el coeficiente r no cambia, esto es, 

r _ S XY _ S X 'Y' __ S X 'Y _ S XY ’ 

S X S Y S X -Sy S X' S Y S X S Y’ 



EJEMPLO 4.4 

El ingreso anual disponible y los gastos de consumo (en dolares) de una muestra 
de 10 familias de un barrio residencial de Lima fueron tabulados en el cuadro que 
sigue, 

Hallar la recta de regresion del consumo (L) con respecto al ingreso (X), 
utilizando la transformacion X 9 = X/1,000, Y 9 = E/1,000. 



www.FreeLibros.me 



102 



Estadistica 



Ingreso 


Consumo 


20,000 


18.000 


14,000 


15,000 


35,000 


30,000 


23,000 


16,000 


12,000 


9,000 


5,000 


7,000 


7,000 


7,000 


14,000 


15.000 


30,000 


26,000 


25,000 


23,000 



SOLUCION. 

Realizamos la codification: X' = X/1,000, Y' — Yj 1,000, del cuadro 4.3 
se obtiene: 



Cuadro 4.3 . C31culos para la regresion lineal 
con datos codificados 



X’ 


r 


XT' 


X' 2 


r 2 


20 


18 


360 


400 


324 


14 


15 


210 


196 


225 


35 


30 


1050 


1225 


900 


23 


16 


368 


529 


256 


12 


9 


108 


144 


81 


5 


7 


35 


25 


49 


7 


7 


49 


49 


49 


14 


15 


210 


196 


225 


30 


26 


780 


900 


676 


25 


23 


575 


625 


529 


185 


166 


3745 


4289 


3314 



SX'=185, lr=166, IXT= 3745, IA’ ,2 =4289, lr 2 = 33I4 
x'= 18.5, 7=16.6 

b = hZXT- ZX'I Y = 10(3745) -185(166) = 7?g 
«ZX ,2 -(IX') 2 10(4289) -(185) 2 



La recta de regresion de Y en X es: 

Y — y — b(X - x ) , 

donde b = 0.778, y = 1000x y'= 16,600, x - 1000 xx'= 18,500 
Resultando, Y - 2,207 + 0.778 X . 
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EJEMPLO 4.5 

A1 estudiar la relacion entre costos (X) y ventas()0 en dolares de ciertos 
productos, a partir de una muestra se obtuvo la siguiente informacion: 

s x =5, s Y =4, x =50, y = 100, Y = 62 + 0.76X 

Si los costos se incrementan en $3 y las ventas correspondientes se incrementan 
en 6 $ 

a) *Como cambia la ecuacion de regresion?. 

b) i.Que porcentaje de la varianza de las ventas es explicada por la regresion de 
ventas sobre costos?. 

SOLUCION 

a) Si X '= X + 3 , Y' = Y + 6 , la ecuacion de regresion de Y' en X ’ es: 

Y'-y'=b\X'-x') 

donde b'~b — 0.76 , y" — y + 6 = 106, x = x + 3 = 53. Esto es 

y , -106 = 0.76(X , -53) 

s s 

b) Se tiene: b — 0.76 , de r = — y b = resulta r = 0.95. 

s x s y s x 

Si se hace la transformacion X r, = X+3,K'=) / + 6, el coeficiente dc 
correlacion r=0.95 no cambia. Por lo tanto, el porcentaje de la varianza de Y ( o 
de Y' ) explicada por la regresion de Ken X (o de Y* en X' ) es la misma: 

r 2 =(0.95) 2 =0.9025. 

EJEMPLO 4.6 (Aplicacion a serie de tiempo) 

Cuando una de las variables es el tiempo (en dias, meses o anos), la regresion se 
denomina serie de tiempo. 

Supongamos que la produccion (en millones) de un determinado articulo 
fabricado por una compama durante los anos 1980-1989 es como sigue: 



Anos 


1980 


1981 


1982 


1983 


1984 


1985 


1986 


1987 


1988 


1989 


Produccion 


92.2 


92.3 


80.0 


89.1 


83.5 


68.9 


69.2 


67.1 


58.3 


61.2 



a) Trazar un grafico de lineas y describir la tendencia. 

b) Hallar la recta de regresion (serie de tiempo) de mmimos cuadrados de la 
produccion en funcion de los anos. 

c) Estimar la produccion de articulos para 1990 y establecer si es significativa tal 

prediccion. 
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SOLUCION. 

a)La figura 4.5 es la grafica de h'neas de la produccion por afios. 




Fig. 4.5 Production de los articulos de 1980 a 1989 

b) Haciendo X' = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, para los anos respectivos: 

1980, 1981, 1982, 1983, 1984, 1985, 1986, 1987, 1988, 1989, 
se tiene: 

IX' = 55, Z Y =761.8, I XT = 3862, IX’ 2 =385, £Y 2 =59513.785 

, nZXT-lX'ZF 10(3862) -55(76 1.8) , 

n SX’ 2 -(ZX') 2 10(385) -(55) 2 

a = y-bx= 76. 1 8 - (-3.97)(5.5) = 98.015 

La recta de regresion es: L=98 — 3.97X 1 , con r=0.94. 

c) Para el ano 1990, X = 1 1 , la produccion para ese ano sera: 

y. = 98 - 3.97 = 98 - 3.97 x 1 1 = 54.33. 



4.3 Nociones de regresion no lineal 

En muchos casos cuando los valores en parejas de las variables X, e Y, no se 
ajustan a una linea recta, se puede conseguir una relation lineal mediante una 
transformacion de estos valores. 

A continuation se dan algunas ecuaciones no lineales y su transformacion lineal 
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Ecuacion Transformation lineal 

a) Y = AB X (exponencial) log Y = log A + (log B)X 

b) Y = AX B (potencia) log Y = log A + B log X 

c) Y — l/( A + BX) (hiperbolica) Y'= A + BX , siendo Y'= 1/Y 

EJEMPLO 4.7 

Ajustar por el metodo de minimos cuadrados una curva de la forma 

y = ax b 

a los siguienies pares de datos: 



X 


1.5 


2 


3 


3.5 


4 


5 


Y 


2.6 


2.4 


1.2 


1.8 


1.6 


1.4 



SOLUCION. 

La transformacion a la regresion lineal es: 

K' = A'+B' X' 



donde: L' = logy, X'^logX, A' = log -4, B' = B 



De la tabla 4.4 se obtiene: 

Z X' =2.1993, Zr= 1.4799. ZXT=0.5891, I X' 2 = 1.4962. Z^ 2 =0.4513 



Cuadro 4.4 , Calculos para la regresion no lineal 



X 


Y 


X =log X 


r=iog y 


XT 


F — 


F 


1.5 


2.6 


0.1761 


0.4150 


0.0731 


0.0310 


0.0.172 


2.0 


2.4 


0.3010 


0.3802 


0.1144 


0.0906 


0.1446 


3.0 


1.2 


0.4771 


0.0792 


0.0378 


0.2276 


0.0063 


3.5 


1.8 


0.5440 


02553 


0.1378 


0.2959 


0.0652 


4.0 


1.6 


0.6021 


0.2041 


0.1229 


0.3625 


0.0417 


5.0 


1.4 


0.6990 


0.1461 


0.1021 


0.4886 


0.0213 






2.7993 


1.4799 


0.5891 


1.4962 


0.4513 



rzZ XT- ZX 1 Z Y' _ 6(0.5891) -(2 . 7993X1.4799) 
nZX ,2 -(ZX') 2 _ 6(1.4962) -(2.6993) 2 

a = y‘-bx= 0.24665 - (~0.532)(0.46655) = 0.4949 



www.FreeLibros.me 



106 



Estadistica 



Ademas, 



r — 



y X Y 



-0.608 



s x s r (1.068X0.7196) 



- = -0.79. 



La ecuacion lineal de regresion es: 

L'= 0.4949 -0.532*' 



La ecuacion no lineal de regresion se obtiene utilizando antilogaritmos: 

Y = anti log(J") = (3. 1 25) X -°' 532 
donde A = anti log(a ) = anti log(0.4949) = 3. 1 25 . 



EJEMPLO 4.8. 

Para los siguientes datos experimentales 



X 


1 


2 


3 


4 


5 


6 


Y 


10 


40 


120 


300 


800 


1500 



Se plantean los modelos: 

Y=Ae BX e Y = a + bX, 

para relacionar Y con X, ( ',cual de los dos modelos se ajusta mejor a los datos? 

SOLUCION. 



Si ajustamos a los datos la ecuacion no lineal Y = Ae liX , su transformacion lineal 
es In Y = In A + BX , esto es 

Y'=a + BX, donde Y’=\nY. a = In A . 

De los datos experimentales se obtiene: 



IX =21, lr=30.481, IXY'= 124.16, IX 2 =91, IY' 2 = 172.53 



nlxr-iA - ir 

«Ia: 2 -[Ix] 2 



0.99876, 



a = y'—Bx - 1 .58443 . 



r =0.9935 

La ecuacion lineal de regresion es: Y s — 1.58443 + 0.99876X 

La ecuacion no lineal de regresion es: Y = anti ln(L') = (4.8765)^ {0 99876,x 
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Si ajustamos la ecuacion lineal Y = a + bX , de los datos se obtiene: 



IX = 21 , lr = 2770, lxr = 14650, IX 2 = 91 , I Y 1 

nlXY-lXlY 

b ~ — — = 283. 143, a-y-bx = -529.33, 

nZX 2 -[Zx] 2 



= 2996100 
r= 0.904 



La ecuacion lineal de regresion es: Y = -529.33 + 283. 143X 

Finalmente comparando los coeficientes de determinacion: r 2 =0.987, para el 

modelo no lineal y r 2 =0.817 para el modelo lineal, se concluye que el modelo no 
lineal se ajusta mejor. 



EJERCICIO 1. 

Si d { - y t — Vj = V, — a - bx i , verificar que: 

a) ±d i= 0, b) %d iXi = 0, c) 5>,v, =0, d) f J (y i -y)(y,-y,) = 0 

i=l i=l i=l i=l 

SOLUCION. 

4 = Z ( y« ~y^ = Y l ^y‘~ a ~ bx ‘ ) = Y l y>~ na ~ b Y l x > = 0 

La ultima identidad es igual a cero por ser la primera ecuacion normal. 

b) ^d i x i = y ^{y i -a-bx i )x i = Y j x i y i -ay^x i -by^x l y i = 0 

La ultima identidad es igual a cero por ser la segunda ecuacion normal. 

Use a) y b) para probar c). Use a), b) y c) para probar d). 

EJERCICIO 2. 

Verificar que 

X (y< ~ y) 2 = S <y. ~ y. ) 2 + X ( y- ~ ^ )2 

SOLUCION 

X ( y<- ~ y )2 = X (v - ~y- + y. - v > 2 

X<y~y) =X(y, -y.) 2 + S ( y- _ - v)2 +2 Z ( y, ~y ■ )( y. - v> 

Por otro lado, 2^ ( V/ — V, )( V, — v) = 0 , por d) del ejercicio 1 . 
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EJERCICIO 3. 

^ SXY 2 Z^-y) 2 

Demostrar que si r = , entonces, r = — — . 

s x s y / ,( y , ~ >0 

SOLUCION. 

r 2 _ s xr s xr _ 5 xr ^xi - _ ^ s xr _ - v ) 

s x 5 r s x s K s* S y ^(y.-y) 2 

Se debe probar que 

*Z(* i -*Xy i -y)=ZU> i -y) 2 

En efecto, 

Zlv, -y .) 2 =Z ( 3 , > - a ~ bx i ) 2 =Yj( y ‘-y +bx - bx ^ 2 
=Z^ -y)-W x i -*)] 2 

= Z^i ~^ 2 +fc2 X (jc i ~*) 2 -2fc^(x, -*)(y, -y) 

Remplazando /; = .v^j- / la segunda y tercera suma del segundo lado de la 
igualdad se reducen a — — x )(v, — y). Luego, 

Z>, - j ) 2 =Z ( y* -y )2 +*£>■ -*)(?. -y) 

Por otro lado, se tiene 

Z ( ^ - y) 2 = Z ( ' v < ~ y«- )2 + Z ( ^ ■ y )2 

Comparando las 2 ultimas identidades se tiene el resultado deseado 
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1. i Por que son iguales los signos del coeflciente de correlacidn y de la pendiente 

de la recta de regresidn de minimos cuadrados?. Rp.' r^bsxfsy. 

2. Dadas las rectas de regresion de minimos cuadrados Y — a+bX y 
X = c + dY. Verificar que bd es igual al coeficiente de determinacion. 

3. Si las graficas de las rectas de regresidn de Y en X y de X en Y forman un angulo 

de 90 grados, ^que se puede afirmar del indice de correlation?. Rp. es cero 

4. Si ( J^| , V| ) , ( » >^2 )*---*( ^ » Vn ) son n pares de datos observados que se 
encuentran en la recta L: Y — mX + b , ^por que L es la recta de regresion de 
minimos cuadrados para estos puntos?, ^que porcentaje de la varianza total de 
los >'j es explicado por L?. 

Rp. por que £(y- y, ) 2 =0, 100%. 

5. Dada la recta de regresion de mfnimos cuadrados Y = a + bX , si se produce un 

incremento igual a c en uno de los valores de X y <xuanto es el incremento 
respectivo que se produce en K?. Rp. be. 

6. Al realizar la regresion de Y en X basado en una muestra de 10 pares de datos 

se tiene que la varianza de los y/ es igual a 16 y que la suma de 
cuadrados debido a la regresion es 140. <^Que porcentaje de la varianza de los y f 
es explicada por la regresion ?. Rp. 87 5%. 

7. El coeficiente de correlation entre dos variables X e Y es r = 0 60. Si s x =1.50, 

Sy = 2.00, x = 10, y — 20, hallar la recta de regresion: 
a) de Y en X y b) de X en Y. 

Rp. a) Y= 12 + 0.8X, b)X=l+0.45Ko r=-2.2 + 2.2X 

8. Si n pares (x, , y, (x„, y n ) son tales que cumplen la relacion 

- V| ~ 5 ^ ’ y s ‘ y ~ c es v^lida la relacion — S x / 5 ?. Rp. si 

9. Si la ecuacion de regresion de Y en X es : Y - 3 + 2X , hallar la ecuacion de 

regresion de T en X\ donde X 9 =X + 3ef=K+6. 

Rp. Y - 9 =2(X'-3) 
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10 . A1 estudiar la regresion lineal entre los ingresos medios (Y en $) y el numero de 
hijos por familia (X), se obtuvo la siguiente informacion: 

x =3, y - 700, s x ~ 0.5yls XY , 

estimar los ingresos de las familias con 4 hijos, ^a cuantos hijos por familia 
corresponderia un ingreso estimado en $712?. 

Rp Y - 688 + 4X > , = $ 704 x = 6 

11 . A1 estimar las ventas (Y) de un articulo en funcion de los precios (X) se uso una 

recta de minimos cuadrados basado en una muestra de 4 datos. Si las ventas 
observadas fueron 10, 8, 6, 14 y si las ventas estimadas respectivas son 10.8. 
8.2, 5.6, 13.4, ^que porcentaje de la varianza de las ventas es explicada por la 
recta de regresidn?. Rp. 96.57%. 

12 . En un estudio de la relacion entre ingresos mensuales y gastos de educacion de 
las familias, una muestra proporciona un coeficiente de determinacion del 
90.25%, medias respectivas de $420 y $120, y desviaciones estandar respectivas 
de $10 y 7$. Segun este estudio 

a) ^En cuanto se estima los gastos por educacion de una familia cuyo ingreso 
mensual es de $300?. 

b) Si una familia estima su gasto por educacion en $370, ^cuanto deberfa ser 
su ingreso mensual?. 

c) Si una familia tiene un aumento de $50, ^en cuanto se incrementaria la 
estimacion de sus gastos en educacion?. 

Rp. Y=- 159.3+0.6665X, a) $40.2, b) $795.94, 0.665x50=33.25 

13 . AI estudiar la relacion entre la edad (X) y la presion sanguinea (K) a partir de 
una muestra de mujeres, se obtuvo la siguiente informacion: 

s x =7.5, Sy = 10, x =50, y = 120, r - 0.90 

a) Hallar la relacion lineal de la presion con respecto a la edad y predecir la 
presion sanguinea para una mujer de 45 anos. 

b) i,Que porcentaje de la varianza de la presion es explicada por la regresion de 
la presion sanguinea con respecto a la edad?. 

Rp. a) K=60+ 1 2X , si x=45 s y = 114,b)8l%. 



14 . Al estudiar la relacion entre el costos(X) y las utilidades (K) en dolares de 
ciertos productos a partir de una muestra se obtuvo la siguiente informacion: 

5 X =5, =4, * = 100, y = 50, F=-26+0.76X. 

a) porcentaje de la varianza de las utilidades es explicada por la regresion 

de utilidades sobre costos?. 
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b) Si cada valor del costo se aumenta en $3 y el valor correspondiente a la 
utilidad se aumenta en 6 $, ^en cuanto se estima la utilidad para un costo de 
$120?. 

Rp. a) r=0.95, ^=0.9025. el 90 25%, b) r-56=0.76(X- 103), 68.92. 

15. Utilizando los n pares de datos (a, , ),... , (a„ , y n ) se obtiene una ecuacion de 

regresion lineal con pendiente igual a -1. Determinar el indice de correlacion 
entre los valores x, e y t si ademas, s x / s Y = 0.9 

Rp. r ~ -0.9. 

16. Si n pares (a, , y\ (a„ , y n ) tienen indice de correlacion r, comprobar que 
la recta de regresion para los puntos (a,*, y (a*, >*) , en donde 

* X: - x * y . - y 

Xj = , y t = para i = 1,2,...,/* , es y = rx . 

s x s Y 

Rp a * = 0. v* = 0, r * = r , entonces y = rx* 

17. Si n pares (a, , y, (x rl >y n ) son tales que cumplen la relacion: Y -bX , 

deducir b usando el metodo de mfnimos cuadrados. Rp. b=Yxy/lx 

18. Una companfa de alimentos maneja una cadena de tiendas al menudeo. Para 
medir la eficiencia de las tiendas se estudio la relacion del numero de empleados 
(X) y el promedio del volumen de ventas mensuales (F) expresado en cientos de 
dolares para todas las tiendas durante el ano pasado. La grafica de los datos 
sugiere.una relacion lineal entre las variables. Se tiene la siguiente informacion: 

n = 1 00, IX =600, Z K = 1600, IXK= 13600, IX 2 =5200, SK 2 =37700 

a) Hallar la recta de mfnimos cuadrados para estimar las ventas partir del numero 
de empleados. 6 En cuanto se estiman las ventas para una tienda de 8 
empleados?. 

b) ^Que porcentaje de la varianza de las ventas es explicada por la variabilidad 
del numero de empleados?. 

c) ^Cuantos empleados tiene la tienda cuya venta promedio se estima en $1 ,100?. 

Rp. a) r=l+2.5X, 21 o $2100. b) r=0.909 . 82.6%. c) 4. 

19. Un estudio de mercado trata de averiguar si es efectiva la propaganda 
televisada de un producto que salio a la venta con relacion al tiempo de 
publicidad (en horas/semana). Se recopilaron datos a partir de la segunda 
semana de iniciada la publicidad resultando el cuadro que sigue. No se pudo 
recopilar datos de la cuarta semana. 
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Semana 


2 


3 


4 


5 


6 


7 


Tiempo de propaganda 


20 


25 


22 


28 


36 


40 


Venta del Producto(S) 


300 


310 


- 


320 


350 


420 



a) i Es efectiva la publicidad del producto?. 

b) i,En cuanto estimarfa las ventas para la semana 4? 

Rp. a) Y= 176.82 + 5.467X, r= 0.92, b) 297. 

20. Un editor tomd una muestra de 7 libros anotando el precio y el numero de 
paginas respectivo, obteniendo los siguientes datos: 



No. de paginas 


630 


550 


400 


250 


370 


320 


610 


Precio ($) 


10 


8 


7 


4 


6 


6 


9 



a) Determine una funcion lineal entre el precio y el numero de paginas con el 
fin de predecir precios. i Que porcentaje de la varianza total de precios se 
explica por esta funcion?. 

b) Estimar el precio de un libro de 300 paginas. Si a este libro se le incrementa 
20 paginas en una segunda edicion, £en cuanto se incrementarfa su precio?. 

c) ^Cuantas paginas deberfa tener un libro cuyo precio se estima en $12.27?. 

Rp. a) y= L22 + 0.013X; 94.5%, b) $5.12, $0.26,c) 850 

21. Una muestra de 5 varones adultos de quienes se observaron las estaturas ( X en 
pies, pulgadas) y los pesos (Ken libras) ha dado los siguientes resultados: 



X 


5V 


5'2” 


5'3" 


5'4” 


5*5” 


Y 


125 


130 


140 


145 


160 



a) Realice una regresion lineal y utilice los datos para verificar que la varianza 
total de K es igual a la varianza residual mas la varianza explicada por la 
recta de regresidn. 

b) Usando la descomposicion de la varianza calcule r 2 e interprete el 
resultado. 

Rp. a) Y= 1 14.5 + 8.5X", X'= 1 .2.3 ,4,5. 750 = 27.5 + 722.5. b) r= 0.96. 



22. Se quiere estudiar la relation entre las edades en ahos (X) de un tipo de 
maquinas que se utiliza en la fabrication de cierto articulo y el numero de 
artfculos (K) que producen. A partir de la muestra de la tabla siguiente: 

a) Determinar la recta de regresion de mfnimos cuadrados para predecir la 
production. Estimar la production para 4, 7 y 8 ahos. 

b) Calcular el porcentaje de la varianza explicada por la regresion de la 
produccion. 

c) Si realmente cada rndquina de la muestra produce 10 artfculos menos 
determinar la recta de regresion. ^Cuanto es el porcentaje de la varianza 
explicada por la regresion de la produccion?. 
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* 


Y 


2 


95 


3 


70, 80 


4 


- 


5 


75 


6 


60 


7 


- 


8 


_ 


9 


45, 50 


10 


25 



Rp. a) Y = 101.5 -6.64*, b) 88%, c) r = 91.5 -6.64* y r no varia. 

23. Sea Y el fndice de precios al consumidor, tomando como base al ano 1980 ( es 
decir 1980 = 100). Para los datos que siguen: 



Ano 


1981 


1982 


1983 


1984 


1985 


1986 


1987 


Y 


106.0 


111 1 


117.2 


121.3 


125.2 


128 0 


132.6 



a) Hallar la recta de minimos cuadrados que se ajuste a los datos. 

b) Predecir el fndice de precios para el ano 1988 y compararlo con el valor 
verdadero (144.4). ^En que ano podemos esperar que el fndice de precios 
sea 150.57, suponiendo que las tendencias presentes continuen?. 

Rp. a) Y= 102.83 + 4.34*. r = 0.994 b) ano 1991 . 

24. Los porcentajes en gastos de publicidad y los porcentajes de beneficios netos 
de ventas en una muestra de 9 negocios es como sigue: 



Gastos 


2.3 


1.9 


3.5 


1.0 


1.5 


4.0 


2.6 


3.0 


2.4 


Beneficios 


4.0 


3.8 


6.2 


2.9 


3.4 


6.8 


4.5 


5.0 


4.2 



a) Hallar la recta de regresion de minimos cuadrados para predecir beneficios 
netos. 

b) Determine el beneficio si el gasto es 5%. ^.Cuanto es el porcentaje de la 
varianza explicada de los beneficios con respecto al gasto?. 

Rp. a) Y= 1274+ 1.32* b) 7 88 y 95.99% 

25. Una fabrica de cierta marca de refresco ha tornado al azar 9 semanas del ano, 
observando la temperatura media correspondiente en grados centfgrados (X) y 
la cantidad de los refrescos en miles (P) pedidos durante cada uno de dichos 
perfodos. Los datos se resumen en la siguiente tabla: 



* 


28 


14 


12 


31 


30 


19 


24 


15 


16 


Y 


60 


19 


12 


75 


70 


40 


55 


25 


25 
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Hallar la recta de regresion de mfnimos cuadrados para predecir la cantidad de 
pedidos. ^Se puede planificar la production en base a la temperatura?. 

Rp. a) Y = -23.9 + 3. 1 54X . b) r = 0.9868 



26. Los siguientes datos son los precios de venta en doiares Y de una marca de 
automoviles usados X anos: 



X 


1 


2 


3 


4 


5 


6 


Y 


6350 


5695 


5790 


- 


4985 


4890 



a) Ajustar una curva de mfnimos cuadrados de la forma Y = AB X . 

b) Estimar el precio de venta de un automovil que tenga 4 anos de uso. 

Rp. a) Y = 6559.78(0.95)* • r =-0.9658. b) y = 5,342.98 

27. Los siguientes datos son la inversion neta (X) y la tasa de interes (Y) 



X 


12 


8 


10 


7 


6 


5 


5 


Y 


4 


5 


6 


7 


8 


9 


10 



Se plantean dos modelos para relacionar Y con X 

Y=AX b e Y=a+bX 

(,Quc modelo se ajusta mejor a los datos?, t ,por que? 

Rp Modelo no lineal, r^O^tX)" 09086 , r=0.93, ^=0.87, Modelo lineal. y=12.63-0.74X f=0.91. 

/"=0.82. Mejor ajusta el modelo no lineal. 

28. Ajustar por el metodo de mfnimos cuadrados una curva de la forma: 

Y = 

A + BX 

a los siguientes pares de datos: 



X 


4 


8 


12 


16 


20 


24 


28 


32 


Y 


24 


21 


20 


15 


14 


10 


7 


5 



Rp. K=l/K K =0.003 146+0.005 176X, ^0.9127 



29. Ajustar por el metodo de mfnimos cuadrados una curva de la forma: 

K = 5 + ? 

A + BX 

a los datos del problema 19. ( hacer primero Y'= Y -5 ). 

30. La presion P (kg./cm 2 .) de un gas correspondiente a diferentes volumenes V 
(cm 3 .) se registro en la siguiente tabla: 
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Ajustar a los datos una curva de rmnimos cuadraticos de la forma: PV = A y 
estimar P cuando V es 110 cm A 



V 


50 


60 


70 


80 


90 


100 


p 


79.7 


65.1 


52.6 


36.8 


25.7 


8.7 



Rp. Y'= 6.84 + 2.83X', PV*** = 6918309.709,11.56, r =0.908 

31. El numero Y de bacterias por unidad de volumen prescntes en un cultivo de X 
horas se registro en la siguiente tabla: 



X 


0 


I 


2 


3 


4 


Y 


20 


35 


50 


80 


190 



Ajustar a los datos una curva de rmnimos cuadraticos de la forma: 

Y = - 10+ A.B X 

y estimar el numero de bacterias a las 5 horas. 

Rp. a)Y =-10 + 27 .7(1. 57 /. 254. r =0.98. 
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4.4 NUMEROS INDICES 



4.4.1 Introduction 

Uno de !os metodos estadfsticos que se utilizan con mayor frecuencia en 
econorma, administracion de empresas, demograffa y otros campos de la estadfstica 
aplicada , es el de numeros indices. 

Basicamente un numero indice. es el cociente de cualquier medicion de una 
variable (o mas variables) con respecto a una de sus mediciones que se toma como 
base. 

El objetivo de los numeros indices es cuantificar variaciones de las mediciones 
de una variable a traves del tiempo. En este sentido el numero indice es el cociente 
de la medicion de la variable en un periodo determinado con respecto a un periodo 
base. 

Las mediciones pueden estar relaeionadas con cantidad, precio o valor. 

Los numeros indices se clasifican en indices simples o elementales e indices 
compuestos o agregados 

El numero indice simple se calcula a partir de una sola variable. Mientras que 
un indice compuesto se calcula a partir de dos o mas variables. 

Los indices compuestos se clasifican en indices no ponderados e indices 
ponderados . 



4.4.2 Indices simples 

Definiclon. Sea x t la medicidn de una variable cuantitabva X registrada en un 
periodo determinado t (ano, mes o dfa) y jc 0 (jc 0 * 0) la medicion de la variable 
para el periodo base Se denomina indice simple de X para el periodo t con 
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respecto al periodo base t 0 , al numero que denotaremos por l t j t o /^ f (X) o /, 
y que se define por: 

l' ltQ (X) = —, o, [ l/ki (X) = — xlOO%. 

x 0 x 0 

El porcentaje de variation entre los valores x 0 y x t se calcula por: 



% variacion 




%=(/ /Ao x 100-100)%. 



Si el porcentaje de variacion es positivo se dice que ha habido un incremento, si 
es negativo se dice que ha habido una baja. 



EJEMPLO 4.8. 

En el cuadro 4.6 se dan los promedios de los salarios, en dolares, de los 
trabajadores de una empresa, de 1975 a 1983. Caleular los correspondientes 
numeros indices para cada uno de los nueve ahos utilizando eomo ano base: 
a) 1975, b) 1978, c) 1983. 



Cuadro 4.6 



Ahos 


salarios 


i 


n d i c e 


s 


1975=100 


1978=100 


1983=100 


1975 


310 


100.0 


81.6 


54.4 


1976 


330 


106.5 


86.8 


57.9 


1977 


370 


119.4 


97.4 


64.9 


1978 


380 


122.6 


100.0 


66.7 


1979 


430 


138.7 


113.2 


75.4 


1980 


450 


145.2 


118.4 


78.9 


1981 


480 


154.8 


126.3 


84.2 


1982 


540 


174.2 


142.1 


94.7 


1983 


570 


183.9 


150.0 


100.0 



SOLUCION. 

a) La primera columna de indices del cuadro 4.6 se obtuvo dividiendo cada cifra 
anual entre 310, que es el salario del aho base 1975 (1975=100) lo que es lo 
mismo multiplicar cada cifra anual por su reciproco: 100/300=0.323 . 

La interpretation del numero indiee es eomo sigue. El mdiee 183.9. por 
ejemplo, significa que en 1983 ha habido un aumento respecto a 1975 de 
(1 83.9 - 100)% = 83.9% . Por otra parte, si la cifra resultante es negativa se dice 
que ha habido una baja. 

Similarmente se calcularon los indices de las otras dos columnas, tomando eomo 
base los ahos b) 1978 y c) 1983 respectivamente. 
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4.4.3 Indices simple de precios, de cantidades, y de 
valores 

Definition. Si p t y p 0 son los valores de la variable precio, P , en los periodos 
respecti vos / y , entonees, el fndice simple de precios en el perfodo t eon respecto 
al perfodo base f 0 , es el numero: 



l, K { p ) = — , o. /,/,„</>) = -^*100%. 

P 0 P 0 

Definition. Si q t y <7 0 son los valores de la variable cantidad, Q , en los periodos 
respecti vos / y r 0 , entonees, indice simple de cantidades en el perfodo t con 
respecto al perfodo base f 0 » e s el numero: 

\ 

(G) = — . O. / (/ , 0 (G) = ^xl 00%. 

Definition. El valor, V, de cierto artfculo en un perfodo determinado es igual a su 
precio mulliplicado por la cantidad vendida (o producida). El indice de valor 
simple en un perfodo determinado t con respecto al perfodo base f 0 , se define por: 

'*■ ^ “ff -- '.a w* 

PoQo 

Donde p t q t y p 0 q 0 son los valores respectivos en el perfodo t y en el pcriodo base 

EJEMPLO 4.9. 

En la tabla 4.7 se dan los precios promedios en dolares y las cantidades de 
consumo promedios en kilogramos de un artfculo desde 1980 a 1982. Tomando 
como base el ano 1980, calcular los indices de precios, de cantidades, y de valores 
para 1981 y 1982. 

SOLUCION. 

Indices de precios: 

/ 8i/8o( /> )=— =— = 1-33 6133% / 8 2 / 8 0 ( /> )=— =— = 1.67 6 167% 

V Pm 15 m ° Pm 15 

Indices de cantidades: 

/ 8 i/8o(G) = — = T7 = 114 6 114%, /82 /8 o(G) = — = ^4 = 1-206 120% 

980 65 980 6 -5 
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Indices de valores: 



'svs cOO-SsSt 

PsoQso 



20x7.4 

15x6.5 



-151.8 ^82/80 (V) — 



P 82<?82 
P8 0#80 



25x7.8 

15x6.5 



Cuadro 4.7 Indice de precios, cantidad y valor 



Ano 


Precio 

$ 


Cantidad 

_ Kg. 


Indice 

Precios 


Indice 

Cantidad 


Indice 

Valor 


1980 


15 


6.5 


100 


100 


100 


1981 


20 


7.4 


133 


114 


152 


1982 


25 


7.8 


167 


120 


200 



4.4.4 Indices compuestos o agregados 

X. 

Definicion. Un numero fndice compuesto se define como una combination dc 
numeros Indices simples cada uno de ellos referidos a una misma base. 

Los indices compuestos se clasifican en compuestos no ponderados y 
compuestos ponderados. 



4.4.4. 1 Indices compuestos no ponderados. 

Uno de los metodos de calculo de Indices compuestos no ponderados o simples, 
es el metodo de la media agregada simple conocida tambien como Indice agregado 
simple. 

Definicion. El indice agregado simple es el cociente de la suma de las medidas de 
dos o mas variables en el perlodo t entre la suma de las medidas de esas variables en 
el perlodo base f 0 • 

El fndice agregado simple de precios de varios artlculos cn un perlodo t con 
respecto al perlodo base f 0 se define por: 




(P) = 



i p, 

I.Po 



El fndice agregado simple de cantidades de varios artlculos en un perlodo t 
con respecto perlodo base f 0 se define por: 




(G) = 
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NOTA. El indice compuesto no ponderado de valor se define por: 



/ 



'/' 0 



00 = 



ZPo<* o ' 



EJEMPLO 4.10. 

En el cuadro 4.8 se da una canasta de artfculos basicos que comprende 4 items 
A, B, C, y D, los precios en dolares y las cantidades consumidas en kilogramos 
durante los anos 1980 y 1985. Tomando el ano 1980 como base, calcular los 
indices compuestos no ponderados de precios y cantidades de 1985 

SOLUCION. 

Tomando el ano 1980 como base, el indice agregado simple de cantidades para 
1 985 resulta: 



, _ 0.8 + 0.9 + 1.50 + 4.50 7.7 

* 1985/1980 ( } “ £> 0 ~ 050 + 0.80 + 1.00 + 3.00 " 5.3 " 



En consecuencia, de 1980 a 1985 hubo un aumento del 45% en el precio de esa 
canasta de artfculos. 

Tomando el ano 1980 como base, el indice agregado simple de cantidades para 
1985 resulta: 



, _ 6.2 + 5.0 + 2.0 + 3.0 

.985/1980 (C) - £ q 0 - 55 + 4 .0 + 15 + 2.4 



16.2 

13.4 



1 . 21 . 



bn consecuencia, de 1980 a 1985 hubo un aumento del 21% de artfculos de esa 
canasta. 



Cuadro 4.8 Cfllculo compuestos no ponderados 





Precio promedio 


Cantidad consumo 


Indices 


Item 


1980 (p 0 ) 


1985(p,) 


1980«7 0 ) 


1 °85( C ] f ) 


Precios 


Cantidad 


A 


0.50 


0.80 


5.5 


6.2 


1.600 


1.127 


B 


0.80 


0.90 


4.0 


5.0 


1.125 


1.250 


C 


1.00 


1.50 


1.5 


2.0 


1.500 


1.333 


D 


3.00 


4.50 


2.4 


3.0 


1.500 


1.250 




5.30 


7.70 


13.4 


16.2 


5.725 


4.960 



NOTA. Otra forma de defimr el indice compuesto no ponderado es el metodo de la 
media aritmetica simple: 

y Indices 
numero de indices. 
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Por ejemplo, por este metodo, el fndice de precios de 1985 con base en 1980, 
(cuadro 4.8), es 5.725/4 — 1.43. Mientras que el fndice de cantidades de 1985 con 
base en 1980 es 4.960/4 = 1.24. 

Los indices compuestos no ponderados asignan igual importancia a cada precio 
o cantidad componente, esto permite que un bien con un precio o valor alto, domine 
el fndice. Por esta razon no es muy utilizado. 



4.4.4.2 Indices compuestos ponderados: de Laspeyres, 
de Paasche y de Fisher 



Las ponderaciones usadas para fndices compuestos de precios son las cantidades 
de los bienes o items. 

Las ponderaciones para el fndices de cantidades agregadas son los precios dc los 
bienes del ano base. 

Defmicion. El fndice de precios de Laspeyres en un perfodo t con respecto a un 
perfodo base t 0 , es la media aritmetica ponderada de los indices simples de precios 

PiIPg que usa como ponderacion a los valores del ano base p 0 q 0 , esto es. 



Defmicion. El fndice de cantidades de Laspeyres en un perfodo t eon respecto a 
un penodo base f 0 , es la media aritmetica ponderada de los fndices simples de 
cantidades q t /qo que usa como ponderacion a los valores del ano base p 0 q 0 , esto 
es. 



Definicion. El fndice de precios de Paasche en un perfodo t con respecto a un 
perfodo base r 0 , es la media aritmetica ponderada de los fndices simples de precios 

Pil Po 9 ue usa como ponderacion a los valores del ano base p 0 q t , esto es. 
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Z Poll 



lP </'c^ = - 



Pi_ 
P 0 



Z^o9» 



Zmi 

ZA)9» 



Deflnicion. El indice de cantidades de Paasche en un perfodo t con respecto a un 
perfodo base f 0 , es la media aritmetica ponderada de los indices simples de 
cantidades qjq^ que usa como ponderacion a los valores del ano base esto 
es. 






Z „ „ <h 
PtQo 

qo_ 

iMo 



Z Pt4t 

YaPtVo 



NOTA. IL t/to (P)yIP t/to (Q) = 



YjPtVo 

Z^Wo 



X 



Z pm 

Z^^o 



z^>^> 

Z^O 






Deflnicion. El indice ideal de Fisher, es la media geometrica de los indices de 
Laspeyres y Paasche. 

El indice ideal de precios de Fisher en el perfodo t es: 

I p t/, 0 ( p ) = ^ tlh) {P)x1P llto (P). 

El indice ideal de cantidades de Fisher en el perfodo t es: 

l p ,/, 0 (G) = (0x^(0). 



EJEMPLO 4.11 

La tabla 4.9 contiene las unidades, precios promedios y consumos per capita de 
3 artfculos basicos en una ciudad en los perfodos de 1980 y 1985. Calcular los 
indices compuestos: a) de precios y b) de cantidades, por los metodos de Laspeyres, 
Paasche y Fisher del perfodo 1985, tomando como base el ano 1980. 



Tabla 4.9 Precios y cantidades de tres items 



Item 


Unidades 


Precio promedio 


Cantidad consumo 


1980( Pq ) 


1985( p t ) 


) 980( q 0 ) 


1985 iq t ) 


A 


litro 


$10 


$15 


40 


60 


B 


pieza 


15 


20 


80 


100 


C 


docena 


20 


25 


20 


40 
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SOLUCION. 

Construyendo la tabla 4.10 para los calculos, resultan: 

a) El fndice de precios de Laspeyres en el periodo 1985 tomando a 1980 como ano 
base: 



^ 85/80 (^) - 



fo 

o9o 



600 + 1,600 + 500 ,1700 ^ 

400 + 1,200 + 400 2,000 



El fndice de precios de Paasche en el periodo 1985 tomando a 1980 como ano 
base: 



^ 85/80 (^) - 



Y,Po<h 



900 + 2,000 + 1,000 3,900 

600 + 1,500 + 800 _ 2,900 



1.34 o 134%. 



El fndice ideal de precios de Fisher de 1985, base 1980 



Cuadro 4.10 Calculo de indices compuestos ponderados 



Item 


Precios por cantidades 


Po Qo 


Pi <7o 


Po <?/ 


Pi <7, 


A 


400 


600 


600 


900 


B 


1,200 


1,600 


1,500 


2,000 


C 


400 


500 


800 


1,000 




2,000 


2,700 


2,900 


3,900 



IfvfloM = V / ^ 5 / 8 0 (^)x^ 85 / 80 ^) = Vl .35 x 1 .34 = 1 .34 ol34%. 



De estos resultados, se concluye que en el ano 1 985 hubo un incremento en el 
precio de esa canasta del 35% segun el metodo de Laspeyres, del 34% segun los 
metodos de Paasche y de Fisher. 



b) El fndice de cantidades de Laspeyres en el periodo 1985 tomando a 1980 como 
ano base es 



^ 85/80 ( 2 ) “ 



0 



600 + 1,500+800 
400+1,200+400 



^ = ,.45 
2,000 



O 



145%. 



El fndice cantidades de Paasche en el periodo 1985 tomando a 1980 como ano 
base es 



ip ^ P ' q ‘ 900+2,000 + 1,000 

85/80 ~Y j p,q 0 ~ 600 +1,600 + 500 



3,900 , 

=1.44 o 144%. 

2,700 
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El fndice ideal de cantidades de Fisher es 



IF 85/80 (G) = Vl .45x1.44 = 1 .44 o 1 44% 



De estos resultados, se concluye que, en el aho 1985, hubo un incremento en 
la cantidad de consumo de esa canasta del 45% segun el metodo de Laspeyrcs, 
del 44% segun los metodos de Paasche y de Fisher. 



Es frecuente cambiar la base de un numero indice en un perfodo dado a un 
perfodo mas reciente para reemplazar los indices que se encuentran obsoletos con el 
fin de que las comparaciones actuales resulten mas significativas. 

Para cambiar el fndice I t j a de base anligua, a , al fndice I t j n de base nueva, n . se 
utiliza la siguiente regia: 



EJEMPLO 4.12. 

En la tabla 4.1 1 se dan los indices A lomando a 1980 como ano base. Obiener 
los indices 

a) B tomando como base nueva al aho 1990, 

b) C tomando como base nueva al aho 1985. 

SOLUCION. 

a) El fndice Bj de 1980 en base 1990 es: 



4.4.5 Cambio del perfodo base 




^ 80/90 “ ~ X h 
1 90/80 

El fndice B2 de 1985 en base 1990 es: 



X / gn/gn X 1 00 — 22.22. 

80/80 450 



^ 85/90 “ ~ 

1 90/80 



100 



x / 05/gn — * 300 — 66.67. 

85/80 450 
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Tabla 4.1 1 Cambio de base 



Ano 


Indice A 


Indice B 


Indice C 


1980 


100 


= 22.22 


C, =33.33 


1985 


300 


B 2 = 66.67 


C 2 =100 


1990 


450 


# 3 = 100.0 


C 3 = 150 



. 100 _ _100 .. n _ IAn 
^90/90 X ^90/80 450-100. 

'90/80 4 ~> U 

b) El indice C| de 1980 en base 1985 es: 

_ 100 100 

^80/85 x ^80/80 “^T X 100-33.33. 

' 85/80 ^00 

El indice C2 de 1985 en base 1985 es: 

lu/a = *r~ x ^85/8o “ * 300 = 100. 

'85/80 3 °0 

El indice C3 de 1990 en base 1985 es: 

. _ 100 _100 . qn _ iqn 

^90/85 " x 1 90/80 “ x 4 50 - 1 50. 

'85/80 3 00 



4.4.6 Empalme o fusion de dos series de numeros 
indices 

Con frecuencia una serie de numeros indices sufre cambios por adicion de 
ciertos productos o exclusion de otros, asi como por cambio del periodo base 
obteniendose una nueva serie de numeros indices. El problema es fusionar ambas 
series de numeros indices a partir de un nuevo periodo base. 

Para fusionar dos series distintas de numeros indices y formar una serie nueva de 
numeros indices, esta nueva serie debe tener un indice de empalme, fusion o 
traslape para las dos series, de manera que se puedan calcular ambos tipos de 
indices para ese ano de traslape. 

Para retroceder Ios indices de la serie nueva, cada indice de la serie antigua se 
convierte en un indice de la serie nueva dividiendo el indice de empalme (100), 
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entire el fndice antiguo de la base nueva, luego multiplicando por el fndice antiguo. 
Esto es, 

t 100 

lndice nuevo = x Indice antiguo. 

Indice antiguo de la base nueva 

Tambien, para avanzar los indices de la serie antigua cada numero fndice de la 
serie nueva se convierte en un fndice de la serie antigua dividiendo el fndice antiguo 
de la base nueva entre el fndice de empalme (100), luego multiplicando por el 
fndice nuevo. Esto es, 

, Indice antiguo de la base nueva 

lndice antiguo = x Indice nuevo. 

100 



EJEMPLO 4.13. 

En la tabla 4.12, la segunda columna muestra los indices antiguos desde 1980 
hasta 1982 con respecto al ano base 1980. La tercera columna muestra los nuevos 
indices de 1982 a 1984 con ano base 1982. Efectue el empalme de los indices con 
base a) 1982 yb) 1980. 

SOLUCION. i 

En el ano 1982 aparecen dos indices, el antiguo 120 y el nuevo 100, este perfodo 
elegimos como empalme. 

a) En la columna de indices empalmados con base a 1982, primero se obtiene el 
coeficiente k = 100/120 = 0.833. Luego, el fndice para 1980 es 0.833(100) = 
83.3, el fndice para 1981 es 0.833(1 10) = 91.63. 

b) En la columna de indices empalmados con base a 1980, el coeficiente es igual a 
k = 120/100 = 1.20. En consecuencia el fndice para 1983 es 1.20(130) = 156, y 
el fndice para 1984 es 1.20(140) = 168. 



Tabla 4.12 Empalme de dos series de indices 



Ano 


lndice 
antiguo 
base 1980 


lndice nuevo 
base 1982 


lndice empalmado 
base 1982 


lndice empalmado 
base 1980 


1980 


100 


— 


83.3 


100 


1981 


110 


— 


91.6 


110 


1982 


120 


100 


100 


120 


1983 


— 


130 


130 


156 


1984 




140 


140 


168 
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4.4.7 Uso de los numeros indices 

Los numeros indices se usan con frecuencia para cuantificar las diferencias de 
los valores de una o mas variables a lo largo del tiempo. Las entidades estatales o 
privadas confeccionan numeros indices para diversos fenomenos economicos. 

Uno de los usos mas importantes de los numeros indices es la denominada 
deflation de precios e ingresos. Esta tecnica es el proceso de "ajustar” precios e 
ingresos y expresarlos en terminos del valor de la moneda de un periodo base. 

Para la deflacion estadfstica se usa como deflactor el indice simple de precios al 
consumidor IPC, indicador del costo de vida. Este indice simple, como ya es 
sabido, se obtiene dividiendo el precio p t en un periodo f, entre el precio pq en un 

periodo base tQ. Esto es. 



/PC = — x 100. 

P o 

El valor (precio o salario) deflacionado o valor real en el periodo t con respecto 
al periodo base fg, se obtiene dividiendo el valor nominal del periodo t entre el IPC 

de ese periodo, ,esto es, ' 

, , _ . valor nominal tnn 

valor deflacionado = x 100. 

IPC 

Si el valor es el precio, se tendra el precio real o deflacionado y si el valor es el 
ingreso o salario, se tendra el salario real o deflacionado . 

Por ejemplo, si el salario de una persona fue de 4,000 unidades monetarias en 
1990 y de 8,000 unidades monetarias en 1991, entonces hubo un incremento 
nominal de $4,000. Pero, si el indice de precio al consumidor fue de 1.2 en 1991 
con respecto a 1990, entonces su salario real es de 8,000/1.2 = 6,666.67 dolares, y 
ha tenido un incremento real de solo 2,666.67 dolares. 

NOTA. 

Si los IPC van decreciendo en una serie de tiempo, los salarios nominales de un 
periodo t se indexan , de manera que no pierdan su poder adquisitivo con respecto a 
un periodo base a ( a<t), multiplicando el salario nominal del periodo a por 
IPC fl IPC a . Por ejemplo, si con respecto al ano base 1989, el IPC de 1990 fue de 

110%, el de 1991 fue de 120% y si el salario nominal en 1990 fue de 1300, 
entonces, el salario nominal en 1991 de manera que no pierda el poder adquisitivo 
de 1990 es: 



Salario nominal de 1991 = x 1,300= 1,418.18. 

110 
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* El indice de salarios reales, ISR y para un determinado periodo r, en base al 
penodo /q, se calcula utilizando la formula: 

SR 

ISR l/t0 =^™. 

Siendo 5/? t el salario real en el periodo t y SRq el salario real en el periodo base fQ. 

* El poder adquisitlvo del dinero, PA , es el recfproco del fndice de precios al 
consumidor. Esto es, 

PA = (\/IPC) x 100% . 

* El indice del poder adquisitivo del dinero, IPA , es el cociente entre el indice 
de precios del ano base, /PQ, que se toma como base de comparacion, y el indice 
de precios al consumidor en el periodo f, lPC t . Esto es, 

IPA = X 100. 

IPC, 

*La perdida del poder adquisitivo, PPA , o el porcentaje de desvalorizacion del 
dinero, se cuantifka por: 



IPC 

PPA = (1 2_)xl00. 

IPC, 

Por ejemplo, si el IPC fue de 1.25 en 1980 tomando como base a 1979, entonces, 
el mdice del poder adquisitivo del dinero en ese ano es: 



IPA = 1.00/1.25 = 0.8, o, 80%. 

Entonces, la perdida del poder adquisitivo es la cifra, PPA = 20% 

EJEMPLO 4.14. 

En la tabla 4.13 se dan los salarios nominales (en dolares) y los indices de 
precios al consumidor de 1980 a 1986 con base a 1980, en una determinada ciudad. 
Para cada periodo y en base a 1980, calcular: a) Los salarios reales, b) los indices 
de salarios reales, c) los indices del poder adquisitivo. 



Cuadro 4.13 



Anos 


Salario 


IPC 


SR 

salario//PC 


ISR 
SRfl 5 


IPA 

\00/IPC 


1980 


75.00 


100 


75.00 


100.0 


100.0 


1981 


80.45 


110 


73.14 


97.52 


90.9 


1982 


93.18 


120 


77.65 


103.53 


83.3 


1983 


104.25 


145 


71.90 


95.87 


69.0 


1984 


130.35 


190 


68.60 


91.47 


52.6 


1985 


170.75 


250 


68.30 


91.07 


40.0 


1986 


200.00 


280 


71.43 


95.24 


35.7 
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SOLUCION. 

a) Los salarios reales , SR, de la cuarta columna se obtienen dividiendo cada salario 

nominal entre su respectivo indice de precios al consumidor, IPC. 

b) Los indices de salarios reales , ISR , de la quinta columna se obtienen dividiendo 
cada salario real entre el salario del ano base que es igual a 75 dolares. 

c) Los indices de poder adquisitivo, IP A, de la sexta columna se obtienen 
dividiendo el IPC =100 del ano base, entre cada uno de los IPC de la tercera 
columna, y expresado luego en porcentajes. 



4.4.8 Tasas anuales y mensuales: Inflacion. 

Uno de los problemas practicos que pese a su sencillez, se presta a dificultades, 
es el de la determinacidn de las tasas de variacion (aumento o disminucidn) anual o 
mensual de un fndice. 

Definicion. Sean I t , t = 1,2,... los indices medidos en los perfodos (meses o anosj: 
1,2,.. .,t,... respectivamente. Las tasa o fndice de variacion del fndice 
correspondiente al perfodo t se define por: 







( l , ^ 


x 100 = 




1 1.-1 J 




U-. J 



Definicion. (Inflacion). Si en la formula anterior los indices son de precios al 
consumidor (IPC), la tasa de variacion se denomina inflacion. 

Por ejemplo, si en diciembre de 1982 el IPC fue 653.1 y en diciembre de 1983 
el IPC fue de 796.1, entonces, el porcentaje de variacion de precios (inflacion 
anual) de 1983 es: 



796.1-653.1 

x 

653.1 



100 = 21.896. 



Definicion. El fndice de variacion acumulado del perfodo a al perfodo t se define 
por: 




x 100- 100. 



siendo de mayor aplicacion cuando el perfodo es mensual. 

EJEMPLO 4.15 

En la tabla 4.14 se dan los indices de precios al consumidor de diciembre de 
1979 a setiembre de 1980, calcular, a) la inflacion mensual, b) la inflacion 
mensual acumulada de diciembre de 1979 a setiembre de 1980. 
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SOLUCION. 



a) Las inflaciones mensuales se dan en la tercera columna. La inflacion, por 
ejemplo, de Marzo de 1980, es igual a, 



120-114 

x 

114 



100 % - 5 . 26 %. 



b) Las inflaciones acumuladas se dan en la cuarta columna. La inflacion acumulada, 
por ejemplo, de Enero ( a ) a marzo (f) de 1980 es. 




x 100 - 100 = 19.9995% - 20%. 



Cuadro 4.14 Computo de la inflacion mensual y acumulada 



Meses 


Indice 

Die. 1979=100 


Inflacion mensual 
IV 


Inflacion mensual 
IV A Acumulada 


Die. 1979 


100 


— 


— 


Ene 1980 


106 


6.00 


6.00 


Febrero 


114 


7.55 


14.00 


Marzo 


120 


5.26 


20.00 


Abril 


130 


8.33 


29.99 


Mayo 


150 


15.38 


49.98 


Junio 


168 


12.00 


67.97 


Julio 


180 


7.14 


79.96 


Agosto 


195 


8.33 


94.95 


Setiembre 


218 


11.79 


117.93 



4.4.9 Devaluation 



La devaluation es la perdida del valor o del poJer adquisitivo externo del dinero 
que se cuantifica generalmente con el precio del dolar. 

Sea C t el nuevo tipo de cambio y C a el antiguo tipo de cambio, el porcentaje de 

aumento del tipo de cambio se define por: 



% aumento = 




1 x 100% 



Por ejemplo, si el tipo de cambio de 2.08 soles por dolar sustituye a uno de 2.02 
soles por dolar, entonces el porcentaje de alza del dolar es 



% alza = 



1x100% = 2.97% 

2.02 J 
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Es decir, hay un aumento en el precio del dolar de 2.91% 
El porcentaje de devaluation se define por 



% devalucion = 




x 100% 



Por ejemplo, si el tipo de cambio de 2.08 soles por dolar sustituye a uno de 2.02 
soles por dolar, entonces el porcentaje devaluacidn del sol es 



% devaluacidn = 




x 100% = 2.88% 



Es decir, el aumento de 2.97% en el precio del dolar produce una devaluation en 
el sol de 2.88%. 



EJERCICIOS 



1. Dados los promedios anuales de los precios al por menor (por kilogramos) de una 
articulo de consumo diario de 1980 a 1985 



Anos 


1980 


1981 


1982 


1983 


1984 


1985 


Precios 


4.8 


5.4 


5.7 


6.6 


6.3 


5.2 



Calcular los indices de precios tomando como base el ano: 
a) 1980, b) 1982. 

Rp. a) en %, 100, 1 12.5, 1 18.75, 137 75, 131.25, 108.33 b) en %, 84,21, 94 74, 100, 1 15.79, 

110 53.91.23 



2. Dadas las siguientes producciones de un bien en kg. 



Ano 


1985 


1986 


1987 


1988 


1989 


1990 


1991 


1992 


Production 


40 


36 


41 


94 


90 


104 


107 


106 



a) Calcular los Indices de production usando como base el ano 1985. 

b) Cambiar la base a 1989. 
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3. Si en 1991 el precio de un bien de consumo fue 12% mas que en 1990, 25% 
mas que en 1992 y 10% menos que en 1989, calcule los indices de precios de 
estos cuatro anos con base en 1989. 

Rp. Los precios e indices (base 1989) de 1989 a 1992 son respectivameme: 1.24a, a, 1.1 2*. 0.896a. 

y 100, 8.65, 90.3, 72.25. 

4 . Si en 1992 la produccion de un bien fue de 15% menos que el ano anterior, 30% 
mas que en 1993 y 40% menos que en 1990, calcule los indices de cantidades de 
consumo de dicho bien de 1990 a 1993 con base en 1992. 

Rp. Las cantidades e Indices (base 1992) de 1990 a 1993 son respectivamente: 1 .42*, jc, 0.85a, 

0.6538a, y 167, 117.65, 100 y 76.92. 

5. Los indices de produccion de un bien de 1989 a 1993 fueron respectivamente 

1.00, 1.15, 1.20, 1.24 y 1.30. Si en 1992 se produjeron 2.79 toneladas de dicho 
bien, calcular la produccion de los demas anos. 

Rp. 2.25. 2.5875, 2.7, 2.79 y 2.925 

6. En enero de 1990 una fabrica gasto en salarios de 50 obreros, la suma de $ 6,000 
y en diciembre del mismo ano con 75 obreros gast6 $9,900. Tomando como 
base el mes de enero, calcular 

a) el indice de empleados para diciembre (cantidad). 

b) el indice de gastos de salarios (valor). 

c) el indice de costo por obrero o fndice per capita (de precio). 

Rp. a) 75/50 = 1.50, b) 9,900/6000 = 1.65. c) Iplq = /v, Ip = 1 65/1 50 = 1.10 



7. Si el indice de cantidad del ano 1990 con base de 1980 es de 1 10 y con base de 
1985 es de 130, calcular el indice de cantidad de 1985 con base de 1980. 

Rp. 0.8462 o 84.62% 

8. En 1994 el precio de venta de un bien se ha fljado en 20% mas con respecto al 
ano anterior. Si se quiere que el valor total de la venta se incremente en 80% 
durante el ano 1994 con respecto al ano anterior, <,en que porcentaje debe 
incrementarse la cantidad de bienes a vender?. 

Rp. /(p)/(q) = /(v), /( q) = 1 .80/1 .20 = 1 .5. debe incrementarse en 50% 

9 . En 1993 el valor de la produccidn de un bien disminuyd en 20% con respecto al 
de 1992, mientras que el precio aumento en 30%, ^cuanto es el porcentaje de 
variacion de la produccidn?. 

Rp. \{q) = 0.6 1 54, disminuyd 38.46% 

10 . Una fabrica bajo la produccion de un bien en 15% de 1993 con respecto a 1992, 

pero aumentd el precio del mismo en 25% en el mismo lapso, calcular el 
porcentaje de variacidn del valor total de las ventas de dicho bien, en 1993 con 
respecto a 1992 Rp aumentd en 6.25% 
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11. Si en el ano 1990 el ingreso de una persona ha tenido un incremento del 1 10% 
con respecto al ano 1985 que era de $10,000 y si por otra parte el indice del 
costo de vida se triplicd en ese lapso, a) ^cuanto es el ingreso real de esa persona 
en 1990?, b) cuanto deberia ser su ingreso nominal de manera que manienga su 
poder adquisitivo de 1985?. 

Rp. a) 21 .000/3 = 7,000, es el 70% de lo que percibfa en 1985, b) $30,000 

12. Los indices de precios ligados o en cadena (Esto es, indices que tienen base 
variable igual al periodo inmediatamente anterior) de 1991 con 1990 es de 1.20 
y de 1992 con 1991 es de 1.40 y de 1993 con 1992 es 1.50. Calcular el mdice de 
precios de 1993 con base de 1990. 

Rp. l f 93/VCF=/91/90 x l r 92A>l x /93/92= 1 -2x l .4x 1 .5=2.52 



13. En la tabla que sigue se dan los precios en soles al por mayor y la production 
en kilogramos de tres artfculos basicos A, B y C de los anos de 1985 a 1987 en 
una determinada region. 

a) Calcular el indice de precios i) media , ii) mediana para 1987 con base en 
1985. 

b) Calcular el indice compuesto de precios de 1987 con base en 1985, por el 
metodo de i) Laspeyres, ii) Paasche, y iii) Fisher. 

c) Calcular el indice compuesto de cantidad de 1987 con base en 1985, por el 
metodo de i) Laspeyres, ii) Paasche, y iii) Fisher. 



Artfculos 


precios 


Cantidad 


1985 


1986 


1987 


1985 


1986 


1987 


A 


2.4 


2.8 


3.6 


3400 


4000 


4300 


B 


32 


44 


55 


60 


66 


75 


C 


12 


18 


25 


30 


33 


37 



Rp. ai) El mdice promedio aritmdtico de precios para 1987 en base a 1985 es igual a 
l/3(3.6/2.4 + 55.0/32.0 + 25/12) = 1.77 o 177%. aii) El indice mediana de precios es 1.72 o 
172%, b) 1.5603, 1.5596, 1.5599, c) 1.2609, 1.26028, 1.2605. 

14. En 1990 el precio de un articulo, expresado en dolares de 1985, fue de $0.60. 

Si el indice de precios credo en un 20% en ese lapso, ^cual es el precio nominal 
de ese articulo en 1990?. Rp 0.72$ 

15. El indice de precios al consumidor respecto a 1989 fue de 120% para 1990 y de 
140% para 1991. ^Que salario nominal debe tener una persona en 1991, si en 
1990 fue de $400?. 

Rp. El salario nominal en el periodo t conociendo el salario nominal del periodo m es 

SN, = ( SNJIPCJ x ipq, sn 91 = (SN^/IPC, o) x wq , . 

SN 9l = (400/120) X 140 = 466.67 . 

16. Los ingresos medios por persona (ingresos per capita) y los indices de precios al 
consumidor de 1977 a 1984 se dan en la tabla que sigue. 
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a) Calcular los aumentos reales y nominates con base 1977 

b) ^Cuales deben ser los aumentos nominates de modo que el poder adquisitivo 

se mantenga igual al del ano 19777. 



Ano 


1977 


1978 


1979 


1980 


1981 


1982 


1983 


1984 


Ingresos 


700 


800 


850 


900 


1000 


1200 


1300 


1500 


I.P.C (%) 


100 


105 


110 


120 


125 


130 


140 


145 



Rp. a) aumentos nominales: 0, 100. 150, 200, 300, 500, 600 y 800 aumentos reales 0, 61 .9. 

72.73, 50, 100, 223, 228.57 y 334.48. b) 0. 35. 70, 140. 175. 210. 280 y 315. 

17. Los salarios anuales de mites de dolares de un empleado y los indices de precios 
al consumidor I.P.C. de 1980 a 1985 se dan en la siguiente tabla: 



Ano 


1980 


1981 


1982 


1983 


1984 


1985 


Salarios 


30 


35 


37 


40 


42 


50 


I.P.C(%) 


100 


120 


130 


140 


160 


167 



a) Hallar los salarios reales de manera que queden expresados en dolares de 
1980 (deflacionar los salarios). 

b) Replantear el salario de 1980 en dolares de cada ano (indexar salarios). 

c) Determine el poder adquisitivo de compra del dolar para cada uno de tales 
anos en terminos del dolar del ano base. 

Rp. a) 30, 29.2, 28.46, 28.57, 26.25, 29.94, b) 30, 36. 39, 42, 48, 50.1 0 1,0.83.0.77. 
0.71,0.625, 0.599. 

18. Dadas las series de indices de precios al consumidor A y B: 



Ano 


1983 


1984 


1985 


1986 


1987 


1988 


1989 


1990 


Indice A, (%) 


100 


110 


130 


135 


- 


— 


- 


- 


Indice B, (%) 


- 


- 


- 


100 


115 


120 


135 


140 



Empalmar los dos series de indices utilizando como ano base 
a) 1986, b) 1983. 

Rp a) 74.1, 81.48. 96.3, 100, 115, 120, 135, 140, b) 100, 110, 130, 135, 155.25, 162, 182.25. 



19. Dadas las series de indices de precios al consumidor A y B de 1983 a 1990 de 
la tabla que sigue: 



Ano 


1983 


1984 


1985 


1986 


1987 


1988 


1989 


1990 


Indice A, (%) 


200 


300 


350 


450 


- 


- 


- 


- 


Indice B, (%) 


- 


- 


- 


90 


100 


130 


150 


200 



a) Empalmar los dos conjuntos de indices utilizando como ano base el ano 

1986. 

b) Calcular la ftiflacion para cada ano. 
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c) Si en 1989 el sueldo promedio de un sector de la industria fue dc $20,000 y el 
de 1985 fue de $12,000, ^en cual de los perfodos el sueldo promedio fuc 
mejor?. 

Rp. a) Indices, en %, B, base 1986: 100. 111.1, 144.4, 166.67, 222.2. Indices empalmados 
44 4, 66.67, 77.78. 100, 1111. 144.4, 166.67. 222.2. c) en 1985. 

20 . Se dispone de las siguientes series: I.P.l, I. P.2 de indices para el precio de 
venta de un bien: 



Ano 


1988 


1989 


1990 


1991 


1992 


1993 


IP 1 


1 


1.25 


2.5 


5 


- 


- 


I. P.2. 


- 




- 


0.75 


1 


1.5 



a) Si el precio de venta de tal bien fue de $30 en 1993, ^Cuanto hubiera sido su 

precio de venta en 1990?. 

b) Determine los indices de precios de venta de 1988 a 1993 con base a 1992. 

Rp a) 7.5, b) 0.15, 0.1625,0.375,0.75, 1 1.5. 

21 . Si la tasa de inflacion del mes dos con respecto al mes uno fue de 2.4% y la del 

mes tres con respecto al mes dos fue de 2%. Calcule la inflacion del mes uno al 
mes tres. Rp. 4.448 

22 . Los indices en porcentajes de precios al consumidor de 1985 a 1990 fueron 
respectivamente: 80, 86.7, 100, 112, 120 y 128. 

a) Calcule la tasa de inflacion de cada ano. 

b) Si para cierto sector laboral el salario promedio era de $200 en 1986 y de 
$300 en 1989, ^en cual de los perfodos el salario promedio fue mejor? 

Rp. a) 8.375, 15.34, 12, 7.14, y 6.67 b) En 1986. 200/0.867 -$230 y en 1989, 300/1 .2 - $250 
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PROBABILIDAD 

5.1 Experimento aleatorio, espacio muestral, eventos 

5.1.1 Experimento aleatorio 

En estadfstica la palabra experimento se utiliza para describir un proceso que 
genera un conjunto de datos cualitativos o cuantitativos. En la mayoria de los casos, 
los resultados del experimento dependen del azar, por lo tanto no pueden 
pronosticarse con exactitud. 

Definition. Un experimento aleatorio es todo proceso que consiste de la 
ejecucidn de un acto (o prueba ) una o mas veces, cuyo resultado en cada prueba 
depende del azary en consecuencia no se puede predecir con certeza 

Por ejemplo, son experimentos aleatorios: lanzar un dado y observar el resultado. 
contar objetos defectuosos producidos diariamente por cierto proceso. aplicar una 
encuesta para obtener opiniones, etc. 

5.1.2 Espacio muestral 

Definition. Se denomina espacio muestral al conjunto que consiste de todos los 
resultados posibles de un experimento aleatorio. Este conjunto se denotara por Q. 

Cada resultado posible de un experimento aleatorio es un elemento del espacio 
muestral. A cada elemento del espacio muestral se denomina tambien punto 
muestral. Esto es, el espacio muestral se describe por 

Q = {co/to es un punto muestral}. 

Si el espacio muestral tiene un numero finito de elementos es posible enlistar a 
todos estos, y si el numero de elementos es grande o infinite el espacio muestral se 
describira mediante un enunciado o regia. 
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EJEMPLO 5.1. 

A continuation se dan algunos experimentos aleatorios y sus correspond ientes 
espacios muestrales: 

1 ) El experimento aleatorio de lanzar un dado y observar el resultado obtenido, es 
de una sola prueba, cuyo espacio muestral se puede escribir como el siguiente 
conjunto de puntos muestrales: 

Qi = { 1 , 2, 3, 4, 5, 6}. 

2) El experimento aleatorio de lanzar una moneda 3 veces, consiste de 3 pruebas, 
cuyo espacio muestral puede escribirse como el conjunto de ternas ordenadas. 

Q 2 = {CCC, CCS, CSC, see, SSC, SCS, CSS, SSS}. 

NOTA. Los espacios muestrales de experimentos aleatorios que consisten de dos o 
mas pruebas sucesivas se obtienen tambien de un diagrama tipo arbol, como el de 
la figura 5.1, para Q 2 . 



3a.prueba 



2a. prueba 




Puntos muestrales 
CCC 

CCS 

CSC 

css 

see 

SCS 

SSC 

SSS 



Fig. 5.1 Diagrama del arbol. 

3) Si el experimento aleatorio es lanzar una moneda y un dado a la vez, y observar 
los resultados, el espacio muestral es el conjunto: 

Qi = { 1C, 2C, 3C, 4C, 5C, 6C, IS, 2S, 3S, 4S, 5S, 6S}. 

4) Si el experimento aleatorio es lanzar una moneda tantas veces como sea 
necesario hasta que aparezea la primera cara, su espacio muestral es el 
conjunto: 

Q 4 = { C, SC, SSC, SSSC,...etc }. 

5) Si el experimento aleatorio es medir la vida util (en horas) de una marca de 
arte facto electrico, su espacio muestral es el conjunto: 



www.FreeLibros.me 



138 



Estadistica 



Q 5 = {r >0} . 

(Aqui, 9? representa a los numeros reales). 

6) Si el experimento aleatorio consiste en determinar la posicion de caida de un 
dardo que es tirado hacia un bianco circular de radio 5 cm., su espacio muestral 
es el conjunto: 

Q 6 =((^,y)69i 2 /j ! +y 2 < 25}. 

Clasificacion de los espacios muestrales. Por el numero de elementos o puntos 
muestrales, los espacios muestrales se clasifican en: 

1 ) Discretos finitos, consisten de un numero Finiio de elementos, por ejemplo, 
los espacios Qj, Q 2 . 

2) Discretos infinitos, consisten de un numero infinito numerable de elementos, 

por ejemplo, el espacio 

3) Continuos, consisten de un numero infinito no numerable de elementos, por 
ejemplo, los espacios Qs, y ^6 



5.1.3 Eventos 

Definition. Se denoi .iina tvi nto a cualquier subconjunto de un espacio muestral. 
Por ejemplo, si Q = { , w 2 w n } es un espacio muestral finito de n elementos. 

en el se pueden definir 2 n eventos diferentes, entre ellos: 

* El evento imposible, 0, que no tiene puntos muestrales, en consecuencia no 

ocurre nunca . 

* Los eventos unitarios o element ales, { w - } . que contienen un solo punto 

muestral. 

* Los eventos compuestos, que consisten de dos o mas eventos. 

* El evento seguro o cierto, Q, el mismo espacio muestral, ya que es el 
subconjunto que contiene a todos los eventos elementales. 

Definiciones: 

1. Se dice que un evento A ocurre, si contiene por lo menos un punto muestral de 
algun experimento aleatorio. Esto es, 

Un evento A ocurre si y solo si existe we A. 

2. Un evento A no ocurre si y solo si w £ A. 
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3. El evento A es un subevento o esti contenido en el evento #, simbolizado, 
A c B, si toda vez que ocurre A ocurre tambien B 

4. Los eventos Ay B son iguales, A = B, si y solo si Ac# y B cz A. 

5. Se denomina complement) del evento A al evento que se denota por A c o A' o 
A , que consiste de todos los puntos muestrales que no estan en el evento A 
(figura. 5.2.a), esto es, 



A c = { vv e Q / w £ A}. 

El evento A c describe el evento de que no ocurra A. 

Operaciones con eventos 

1. Se denomina union de los eventos Ay#, al evento Au# que consiste de 
todos los puntos muestrales que pertenecen a A o a B, o a ambos (figura. 5.2 b), 
esto es, 

Au# = {w'eQ/weAvwe#}. 

El evento Au B describe el evento de que ocurra por lo menos uno de ellos 

2. Se denomina interseccion de los eventos A y # al evento An # que consiste de 

todos los puntos muestrales que son comunes a A y a # (figura 5.2 c), esto es, 

Ar\B-{weQ/weAAweB}. 

El evento \ describe el event de que oc urran ambos A y #. 

3. Dos eventos Ay# son mutuamente exciuyentes o disjuntos, si no tienen 
elementos en comun (figura 5. 2d), esto es, si A # = 0 , 



o' 




©j 

















Fig. 5.2. a) Complemento Fig.5.2. b) Union Fig.5.2. c) Interseccion 

En general, diremos que los eventos: A, , A 2 ,..., A n son mutuamente exciuyentes 
si, 

A t Ci Aj = 0, Vi * j, i, j = l,2,3,...,n 
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4. La diferencia del evento A menos B es el evento A- B , que consiste de todos 
los puntos muestrales que pertenecen al evento A y no pertenecen al evento B 
(figura. 5.2e), esto es? 

A-B = [wsC1/wgAaw^B) 

El evento A — B = Ar^B 1 describe el evento de que ocurra A y no ocurra B 





Fig. 5.2 d) Disjuntos Fig. 5.2 e) Diferencia 

5. El producto cartesiano de los eventos A y B , es el evento AxB que consiste de 
todos los pares ordenados de puntos muestrales (w, , w 2 ) , siendo e A y 
w 2 e B , esto es, 



A X B = {(Wj , W 2 )/ Wj g A a w 2 g /?}. 

El evento AxB describe d evento de que ocurra 1° A y 2° B. 

El espacio muestral Q asociado a un experimento aleatorio compuesto de 
dos experimentos aleatorios £2, y Q 2 > cuyos espacios muestrales respectivos 
son Qj y Q 2 * se puede expresar como un producto cartesiano, esto es, 

&Q = Q 1 xQ 2 

Por ejemplo, si se lanzan 2 monedas, a la vez o en forma consecutiva, y si 
Qj y Q 2 son los espacios muestrales de las monedas 1 y 2 respectivamente, 
entonces, el espacio muestral Q del experimento compuesto es: 

Q = Qj x Q 2 = {C,S} x {C,5} = {(C, C),(C, S),(S,C),(S,S)}. 



Algebra de eventos 

Las siguientes identidades basicas se verifican para eventos 

1) A\jA = A , Ar\A = A 

2) A<jB = BuA, AnB = Br\A 

3) AuA c =Q, Ar^A c =0 

4) Au0 = A, An0 = 0 
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5) /\uQ = Q, Ar\Q = A 

6) Q c =0, 0 C =Q. (A c ) c = A 

7) An(fiuC) = (Anfi)u(AnC) 

Au(finC) = (Aufi)n(AuC) 

8) =A C nB c , (AnB) c = A c kjB c 



NOTA. 

Sea A ,A 2 ,...,A n cualquier coleccion finitade^ eventos. 



1. El evento de que ocurra por lo menos uno de ellos se describe por el conjunto: 

n 

A,wA 2 u-uA„ =(JA- 
1=1 

2. El evento de que ocurran todos ellos juntos se describe por el conjunto: 



3. 



n 

A, r\A 2 n...r> A„ =p)A- 



i= 1 



La regia de De Morgan, 



u* 



=n<A>'. 



flA 



i=l 



i=l 




4 . El producto cartesiano de los n eventos es el evento: 



A x A 2 *...*A n ={(^^2 e A, V/ = 1,2, 



Este evento se utiliza para describir los resultados de un experimento aleatorio 
compuesto de n experimentos aleatorios simples, por ejemplo, tirar un dado n 
veces o tirar n dados a la vez. 



5.2 Conteo de puntos muestrales 

Cuando es grande el numero de resultados posibles de un experimento aleatorio, 
no suele ser facil el recuento de tales resultados, por eso, es necesario dar ciertas 
reglas que nos faciliten el conteo de puntos muestrales. 

5.2.1 Numero de puntos muestrales 

El numero de elementos de un evento arbitrario A se denota por n(A ) o por #M). 
Es evidente que: 
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n(0)= 0 y n( A) > 0 , para todo evento A. 



Regia de la multiplicacion. 

" Si una operation puede realizarse de n x formas y por cada una de estas una 
segunda operation puede realizarse de n 2 formas, entonces, las dos operaciones 
pueden realizarse de n x xn 2 formas". 

Esto es, si A y B son dos conjuntos finitos, entonces, el numero de elementos 
del producto cartesiano AxB esta dado por 

n(A) x n(B) 

Por ejemplo, ^cudntos elementos tiene el espacio muestral que resulta de lanzar 
dos dados a la vez?. 

Si A es el evento "resultados del dado 1”, entonces, n(A) = 6 y si B es el evento: 
"resultados del dado 2", entonces, n(B) = 6. Luego, el numero de resultados 
posibles al lanzar los dos dados es igual a: 

n(A) x n(B) = 6 x 6 = 36. 

La extension de la regia de la multiplicacion con k experiments se puede 
expresar en terminos de conjuntos como sigue: 

Si A, , A 2 ,’", A k son k conjuntos finitos, entonces, el numero de elementos del 
producto cartesiano A x x A 2 x • - * x A k es igual a: 

n( A, ) x n(A 2 ) x x n(A k ). 

Por ejemplo, ^cuantos numeros pares de tres digitos distintos se pueden formar 
con los digitos: 1, 4, 7, 8, 91. 

Si A, , A 2 , y A 3 , representan los digitos de centenas, decenas y unidades 
respectivamente, entonces, n( A 3 ) = 2 , n( A 2 ) = 4 , n( A, ) = 3 . Luego, el total de 
numeros es: n(A, x A 2 x A 3 ) = 3x4x 2 = 24 

3 i a 

Por dar otro ejemplo, suponga que de una urna que contiene n objetos 
numeradas de 1 a n se escogen k de ellos una a una. Sea A f el evento que denota 

los posibles resultados de la extraction i. i = l t 2,...,A . El numero de formas de 
extraction es igual al numero de elementos del evento A, x A 2 x ... x A k , esto es, 

n(A, ) x n(A 2 ) x ... x n(A k ) = nx nx ... x n - n k , 

k veces 

si la extraction es con reposition , y es igual a: 
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n(A } )xn(A 2 ) x...x n(A k ) = nx(«-l)x(/i-2)x...x(n-^ + l), 
si la extraction es sin reposiciOn. 

Cada elemento (a, , a ly ...,a k ) del evento A } x A 2 x...*A k se denomina en el 
primer caso, variation con repetition, y en el segundo caso, variation sin 
repetition 

Regia de la adicion. 

1 . Si A y B son eventos mutuamente excluyentes, entonces, 

n(A ^ B) = n(A) + n(B). 

Por ejemplo, el experimento de lanzar una moneda o un dado tiene 2 + 6 = 8 
resultados posibles. 

2. En general, si los n eventos A x , A n , no ocurren mutuamente juntos 
(son disjuntos mutuamente), entonces, 

n 

n(A^ kjA 2 KJ„,A n ) = y,n(A). 

1=1 

3. Si A y B son dos eventos cualesquiera, entonces, 

n(A u B) = n(A) + n(B)~~ n(A r\ B) 

4. Utilizando 3) se verifica que si A, B, y C son tres eventos cualesquiera, 

n(Au BuC) = n(A) + n(B) + n(C) - n(AB) - n{AC) - n{BC) + n(ABC). 



5.2.2 Variaciones 

A) Variaciones simples 

Definition. Se denominan variaciones simples o sin repetition o simplemente 
variaciones de k objetos tornados de n objetos distintos, a cada uno de los arreglos 
u ordenes que se hagan con los k objetos, de manera, que estos arreglos difieran 
en algun elemento o en el orden de colocation. 

Por ejemplo, las variaciones de 2 elementos del conjunto A = {a,b,c,d} son 
los siguientes arreglos: 

ab, ac, ad, ba, be, bd, ca , cb, cd , da, db, dc. 
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El numero de variaciones diferentes de k objetos tornados de n objetos 
distintos, denotado por V" o n V k , esta dado por: 

V£ = n(n-\)(n- 2)...(n-k + \) = — — — . 

(n-k)\ 

En efecto, hay n posibilidades para la primera posicion, (n — 1) para la segunda, 
...etc.,., y, (n — k + l) posibilidades para la £-esima posicion. Luego se aplica el 
principio de la multiplication. 

Por ejemplo, el numero de variaciones de 2 objetos tornados de 4 objetos 
diferentes es: 

. 4 1 

V, 4 =4x3 = — = 12. 

(4-2)! 

NOTA: Una formula de recurrencia para el total de variaciones (para programar 
variaciones) es la expresion siguiente: 

v;=(n-* + i )v;_ r 



B) Variaciones con repeticion 

Definicion. Se denominan variaciones con repeticion de k objetos tornados de n 
objetos distintos, a cada uno de los arreglos de k de tales objetos de manera que 
dos, tres , k de ellos, puede ser uno mismo de los n objetos. 

Por ejemplo, las variaciones con repeticion de dos elementos tornados de los 
elementos a,b y c son: 

aa , ab, ac, ba, kb. be , ca, cb. cc. 

El numero de variaciones con repeticion de k objetos a partir de n objetos 
distintos, que denotaremos por y/j" , es: 

VR n k =(n)(n)...(n) = n k 

k veces 

Por ejemplo, el numero de variaciones con repeticion de dos elementos tornados de 
3 elementos distintos es: 

VR\ =3x3 = 3 2 =9. 
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4. Un lote de N articulos contiene k defectuosos describir el espacio muestral del 

numero de articulos extrafdos hasta obtener el ultimo defectuoso. 

Rp Q={ k. k+ 1 . k+2 N) 

5. a) Describa el espacio muestral del funcionamiento del siguiente sistema: 




donde Aj = 1 si esta operativo, A} - 0 si esta descompuesto, i= 1 , 2, 3. 

b) Describa los eventos A:” por lo menos una componente funciona", y 
B: "todo el sistema funciona". ^Son A y B mutuamente excluyentes?. 

Rp Q={(.t |,jt2**3)Af=0,l , i= 1,2,3, ), b) no. 

6. Un experimento consiste en observar la vida util de dos objetos, describa el 

evento "la duracion del primero mas la duracion del segundo es al menos 4 
anos". Rp. Q = lu, v)/A + y >4}. 

7. En un edificio de 10 pisos entran al ascensor al primer piso 3 personas. Cada una 

baja al azar a partir del segundo piso. ^De cuantas maneras esias personas 
pueden bajar en pisos diferentes?. 

Rp 9x8x7=504. 

8. Cierto producto se arma en tres etapas. En la primera hay 5 lineas de ensamblado, 

en la segunda 6, y en la tercera 4. ^De cuantas maneras distintas puede hacerse 
circular el producto durante el proceso de ensamblado 7 . 

Rp. 5x6x4 . 

9. Una caja contiene 8 dulces de piha, 6 de naranja y 4 de fresa. ^Cuantos elementos 

tiene el espacio muestral que resulta de extraer al azar un dulce de cada sabor?. 

Rp. cfcfc, 4 = 192 



10. Cinco alumnos forman cola en la ventanilla de la secretarfa de la facultad. 

a) ^De cuantas maneras diferentes pueden hacer la cola?. 

b) ^.De cuantas maneras si el mas alto debe estar al comienzo?. 

c.) ^De cuantas maneras si el mas alto y el mas bajo deben estar en extremos 
opuestos?. 

d) ^De cuantas maneras si el mas alto y el mas bajo no deben estar juntos?. 

Rp. a) 5!, b) 4!, c)3!2. d)5! -4!2l 

11. Cierta marca de sierra electrica es calificada por especialistas, en cuanto a 
rendimiento, como: "Muy buena", (B 1 ); o, "buena", (B2); o "regular", (B3), y 
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en cuanto al precio, como "cara", (Cl), o "barata"; (C2). <De cuantas maneras es 
calificada la sierra electrica por los especialistas?. 

Rp. 6. 

12 . Un vendedor de automoviles acaba de recibir un embarque de 15, de los cuales 
10 son del modelo A y 5 del modelo B. ^De cuantas maneras puede vender 4 de 
los automoviles, 

a) si los 4 son del mismo modelo?. 

b) si dos son del modelo A?. 

c) si al menos uno es del modelo B?. 

Rp.a) C‘°+C 4 5 .b) C^Cf , c) l£ = ,CfcJV 

13 . Suponga que una urna contiene 10 fichas de color bianco, 10 de color rojo, 10 
de color amarillo y 10 de color negro. Las Fichas del mismo color van 
numeradas ae 1 a 10. Un experimento consiste en extraer al azar una de las 
fichas de la urna. Dados los eventos: A: "color bianco”. B: "numero menor que 
4", y C: "numero par", determinar el numero de puntos muestrales de los 
siguientes eventos compuestos: 

Ar^B, Ar>C. Ac\BdC. Ar\B L \ A c r\B, A c r^B c r\C. A L r\B c r\C L 
A c r\ B r\C c * Ar^B c r^C c \A l kjB c kjC 1 

14 . ^De cuantas maneras diferentes pueden colocarse en un estante 6 libros de 
Matematica, 2 de Historia y 4 de Logica si los libros de la misma materia deben 
estar juntos y si, 

a) no se distingue entre los libros de la misma materia? 

b) se distingue entre los libros de la misma materia? 

Rp.a) = — — — = 13.860, b) <6!x2! x4!)3!=207,360 
‘ 6*x2*x4! 

15 . De 8 hombres y 7 mujeres ^cuantos comites de 10 miembros se pueden formar 
si cada uno de ellos debe contener cuando menos 5 mujeres ?. 

Rp. CfC, +C\Cl +CfC 7 7 = 1772 

16 . ^Cuantas parejas se pueden elegir de 4 hombres y 6 mujeres si cierto varon 
rehusa tener como pareja a dos de las mujeres?. 

Rp. c, 4 +c, , c 1 6 
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17. Seis hombres y seis mujeres compiten realizando cierta tarea. Si los scis 
primeros puestos son ocupados por 4 hombres y dos mujeres determine cl 

numero de casos. Rp. 6! C^Cf = 162,000 



18. ^Cuantas sumas diferentes de dinero se pueden formar con cuatro 



monedas cada 



una de distinto valor?. 



Rp I C 4 =2 4 1 
/=l 1 



19. Una compania desea ascender a 3 de sus 10 gerentes a posiciones de 

Vicepresidente de ventas, de manufacturas y de finanzas Hallar el ni ^ mero 
formas distintas de efectuar los ascensos. D w io 

Kp. 

20. ^De cuanlas maneras diferentes puede un padre dividir 8 regalos entre sus 3 
hijos, si el mayor debe recibir 4 regalos y los menores 2 cada uno?. 

Rp. C\C\C\ = 420 



21. Dados los conjuntos A de 4 elementos y B de 8 elementos, ^cuantos conjuntos 
de 6 elementos se pueden formar si cada conjunto debe contener: 

a) solo un elemento de A?, b) cuando menos un elemento de A?. 

Rp a) 224 b) 896 



22. Hallar el numero de formas diferentes en que se pueden hacer 

i) una selection , ii) un ordenamiento con 4 letras de las palabras: 

a) Cloroformo, 

b) Elimination . 

23. Un estudiante debe contestar 5 de 7 preguntas de un examen, 6 de cuantas 
maneras diferentes puede escoger las cinco 

a) sin ninguna restriction?. 

b) si las dos primeras son obligatorias?. 

c) si debe contestar 3 de las 4 primeras?. 

Rp. a) C 5 7 ,b)C 3 ,c) (?2 

24. Un estudiante planea matricularse en los cursos A, B, y C, Los horarios de A 
son a las 8, 1 1 y 15 horas. Los de B son a las 8, 10 y 15 horas y los de C a las 
10, 12 y 15 horas. Si las clases son de una hora. <cuantos horarios distintos 
puede preparar en los 3 cursos de manera que no haya cruces?. 

Rp. ABC: 2. ACB 3 BAC: 4. BCA 4. CAB 1, total 14 
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25. ^De cuantas formas pueden instalarse en linea 5 focos blancos y 6 focos rojos si 
deben colocarse a) alternativamente?, b) los blancos juntos?. 

Rp.a) 5!x6L b) 7!x5! 

26. Un microbus tiene 29 asientos para pasajeros, distribuidos en 6 filas de 4 
asientos cada uno, con un pasillo en el medio y al final 5 asientos juntos. ^De 
cuantas maneras diferentes podran ubicarse 25 pasajeros de modo tab que los 14 
asientos que dan a las ventanillas queden ocupados?. 

p. 1/ 25,/ 15 

Rp. V l4 V u 



27. De un conjunto de n objetos numerados de 1 al n (n > 4), se seleccionan k 
objetos a la vez. <En cuantos casos, 

a) todos son menores que m (1 < m < n)l. 

b) solo 3 son mayores a m (k> 3)?. Rp. a) C™~ ] , b) C$ m C™_i . 

28. Se tienen 40 flchas, donde hay 4 de color rojo. Si se reparten estas fichas enue 

4 ninos, de manera que a cada uno toque 10 fichas. ^,En cuantos casos a cada 
uno toca una ficha roja?. Rp. 4!x36!/(9!) 4 . 

29. Un grupo de 5 hombres y 10 mujeres, se divide al azar en 5 grupos de 3 
personas cada una. Calcular el numero de maneras en que cada grupo contenga 
un hombre. 

Rp. (C, 5 C‘ 0 )(C, 4 Cf )(C, 3 C 2 6 )(C, 2 C 2 4 )(CJ C\ ). 

30. Se tiene n objetos igualcs numerados de 1 a n . n >3 

a) Si se permutan los n objetos, ^de cuantas maneras k (k < n) de ellos 
ocuparan sus posiciones correspondientes?. 

b) Si se tienen 3 cajas en las cuales se distribuycn los objetos, ^de cuantas 
maneras diferentes se pueden distribuir a fin dc que solo una caja quede 
vacia?. 

Rp. a) ((/I-*)!) c; . b) (2- -2 )C 2 3 

31. Se distribuyen k bolas numeradas de 1 a k en n (k < n ) cajas alineadas, ^de 
cuantas maneras k cajas vecinas conticnen una sola bola cada una?. 

Rp (n -k + 1)A!. 
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5.3 Probabilidad de un evento 

Definicion. (Axiomatica) 

Sea Q el espacio muestral asociado a un experiment aleatorio. La 
probabilidad de cualquier evento A de Q , es ei numero real P(A) que satisface los 
siguientes axiomas: 

PI) P(A)>0, para todo evento A. 

P2) P(Q) = 1. 

P3) Si A y B son dos eventos mutuamente excluyentes, entonces, 

P{AkjB)= P(A) + P(P). 

De los axiomas de probabilidad resultan los teoremas que siguen: 

TEOREMA 5.1. 

Si 0 es -el evento imposible, entonces P(0) = 0. 

Demostracion. 

Los eventos Q y 0 son disjuntos. Ademas, Q-Du0. 

Por el axioma P3, P(Q) — P(Q) + P(0), de donde resulta P(0) = 0. 

NOTA. Si P(A) - 0. entonces, no necesariamente A =0 (una justificacion se 
halla en la seccion 5.4.3, otra en el capitulo 6, seccion 3). 

TEOREMA 5.2. 

Si A ‘ es el evento complementary del evento A, entonces, 

P(A) = 1-P(A') o P{A L ) = l-P(A) . 

Demostracion. 

Los eventos Ay A c son disjuntos. Ademas Q = A u A c 

Por el axioma P3), P{Q) = P(A) + P(A C ) y por P2), 1 = Pi A) + P(A L ) . 

De donde resulta que P(A C ) = 1 - P{A) . Tambien P(A) = 1 - P(A L ) 

TEOREMA 5.3 

Si A y B son dos eventos tales que A d B, entonces, P( A) < P(B) 
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Demostracion. 

Ad B , implica B = Ad>(B - A) , donde A y B - A son eventos disjuntos. For 
el axioma P3) se tiene, P(B) = P(A) + P(B - A) o P(B) - P(A) = P(B - A) Por 
otra parte, por el axioma PI), P{B - A) >0. De donde resulta P{B) - P(A) > 0 , o 
P(A)<P{B). 

NOTA. Para todo evento A , se verifica, 0 c A c Q , entonces, 

P(0) < P(A) < P(C2 ) , 
consecuentemente 0 < P(A) < 1 . 

NOTA. La probabilidad P es una f tuition definida en eventos que son partes 

de Q y que asocia a cada evento A el numero real P(A) G [0,1] y que satisface 
los axiomas: PI), P2) y P3). 

TEOREMA 5.4 ( Regia de la adicion de eventos ). 

Si A y B son dos eventos cualesquiera, entonces: 

P(AkjB)= P(A)+ P(B)~ P(Ar^B) 

n 




Demostracion. 

(Usaremos la notacion AB por Ar\B). De la figura 5.3 se obtiene: 
Akj B = Akj (A 1 B ) , siendo. Ay A L B disjuntos. 

Ademas, B = AB u ( A L B) . siendo AB y A c B tambien disjuntos. 

Por el axioma P3), 

P(A kjB) = P(A) + P(A L B) y P(B) = P(AB) + P(A L B) . 
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De estas dos identidades resulta: 

P(A u B) = P( A) + P(B) - P(A n fi) 

NOTA. Una consecuencia inmediata del teorema 5.4 es: 

P(A kjB)< P(A) + P(B) 

NOTA. El lector deberfa verificar que para tres eventos cualesquiera A, B y C, 
aplicando el teorema 5.4 se tiene: 

P(A uBuC) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(A£C) 
Esta regia se generaliza para n eventos (ejercicio para el lector) 

EJEMPLO 5.9 

Suponga que en un sorteo la probabilidad de ganar el primer premio es 2/5 y la 
de ganar el segundo premio es 3/8. Si la probabilidad de ganar al menos uno de los 
2 premios es 3/4, calcular la probabilidad de ganar: 
a) solo uno de los dos premios, b) ninguno de los dos premios 

SOLUCION. 

Sean los eventos: A: "ganar el primer premio" y B: "ganar el segundo premio". 
Se tiene P( A) = 2/5, P(B) = 3/8, y P( A u B) = 3/4. 

Sustituyendo P(A) = 2/5, P(B) = 3/8, y P(A*u B) = 3/4 en 

P(AkjB) = P(A) + P(B) - P(A n fl) 

2 3 3 1 

resulta P(A + = — . 

5 8 4 40 

Las probabilidades de cada una de las partes de Q se indica en la figura 5.4. 




a) La probabilidad de ganar s61o uno de los dos premios es: 
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P[AB' o A'B] = 



15 14 29 



40 40 40 



b) La probabilidad de no ganar ninguno de los dos prcmios es: 

P(A C B c ) = — 

40 

NOTA. (Extension del axioma P3) 

1. Utili/ando el axioma P3), por induccion: se verifica que: 

Si Aj . A 2 , ■ ■ ■ . A n son n eventos mutuamente excluyentes dos a dos. entonces. 



2. En teoria de probabilidad avanzada, en lugar del axioma P3 o su generalizacion. 
la nota anterior, se utiliza el axioma siguiente: 

P4) Si A x ,A 2 y' ■*, es una sucesion infinita de eventos que sc excluyen 
mutuamente dos a dos, entonces. 



5.4 Calculo de probabilidades 

5.4.1 Espacio muestral finito 

Sea Q. = { h*, , w 2 , - • - , w n } , un espacio muestral finito de n elementos. Este 
espacio se puede expresar como una union (disjunta) finita de sus eventos 
elementales { w £ * } , esto es. 



HUa =&(A)- 



i=i j 1=1 



PM, UA,U...) = P Ua =Z P( A)’ 



(=1 J 1=1 



71 



o=Uki- 



Entonces, utilizando los axiomas P2) y P3) resulta. 

f n \ n 
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Si todos los eventos elementales { w^} son igualmente posibles (o equiprobables) y 

si P({w l }) = p , entonces, np = i , de donde, p = ^ . Consecuentemente, si A 

n 

es cualquier evento del espacio equiprobable Q que consiste de k 
(0 < k < n) puntos muestrales, entonces, la probabilidad de A es el numero: 



P(i4) = — + — + — 

n n n n 

\ v J 

k veces 



n(A) 

n(Q) 



P(A) = 



n{A) 

n(Q) 



Casos favorables a A 
Casos posibles 



Se deja como ejercicio para el lector, verificar que el numero P(A) = 



#(A) 

#(«) 



es una 



probabilidad, es decir, satisface los axiomas: PI, P2 y P3. 



EJEMPLO 5.10 

Se lanza un dado y se observa el numero obtenido. Calcular la probabilidad de 
obtener a) 3 puntos, b) al menos 5 puntos 

SOLUCION 

El espacio muestral del experimento aleatorio que consiste en lanzar un dado y 
observar el resultado, es el conjunto: Q=1 1,2,3,4,5,6} 

a) Si A es el evento: “obtener 3 puntos”, entonces, /\={3}, y la probabilidad de A es 
el numero: 



P(A) = 



n(A) 
n( Q) 



- = 0.167. 
6 



b) Si B es el evento: “obtener al menos 5 puntos”, entonces, #={5,6}, y la 
probabilidad de B es el numero: 



P(B) = 



n(A) 

n(Cl) 



2 

6 



EJEMPLO 5.11. 

Se lanza un dado 2 veces consecutivas. Calcular la probabilidad de obtener: 

a) 7 puntos. 

b) 6 puntos solo en la segunda tirada. 

e) 7 puntos 6 6 puntos solo en la segunda tirada. 
d) 7 puntos y 6 puntos solo en la segunda tirada. 
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SOLUCION. 

El espacio muestral del experiment aleatorio que consiste en lanzar un dado 
dos veces y observar los puntos obtenidos, es el conjunto: 

Q *l(«.J4/i, 7 = 1,23,4,5,6} 

#(f2) = 36 , este espacio tiene 36 eventos elementales equiprobables. 

a) Si A es el evento, obtener "suma 7 puntos". entonces. 

A = {(1,6), (6,1), (2,5), (5,2), (3.4), (4,3)} , #(A) = 6 
y su probabilidad es el numero: 

n(Q) 36 6 

b) Si B es el evento "sale 6 solo en la segunda tirada", entonces, 

B= {(1,6), (2,6), (3,6), (4,6), (5,6)}, #(fl) = 5 
y su probabilidad es el numero 

P(B) = = — = 0. 1 39. 

36 

c) El evento "sale suma 7 o solo 6 en la segunda tirada" es: 

A B= {(1,6), (6,1), (2,5), (5,2), (3,4), (4,3), (2,6), (3,6), (4,6), (5,6)} 
y su probabilidad es el numero: 

= = — = 0.278. 

«(Q) 36 

d) El evento "sale suma 7 y solo 6 en la segunda tirada" es: A n B ={(1,6)} 
y la probabilidad de este evento es el numero: 

P(AnB)= = — = 0.0278 

n(Q) 36 



EJEMPLO 5.12. (Espacio muestral no cquiprobable). 

Un dado se carga de tal manera que un numero par tiene el doble de posibilidad 
de salir que un numero impar. Se lanza este dado y se observa el numero obtenido. 
Calcular la probabilidad de obtener al menos 3 puntos. 
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SOLUCION. 

El espacio muestral del experimento aleatorio de lanzar este dado y observar el 
resultado obtenido es el conjunto: 

Q = {1,23,4,5,6} 



Si p es la probabilidad de obtener un numero impar entonces 2 p es la probabilidad 
de obtener un numero par. Del axioma P2) se tiene P(Q) = 1, luego, 9p =1, de 
donde resulta p = 1/9. 

Si A es el evento: "obtener al menos 3 puntos", entonces, A = {3, 4, 5, 6} y la 
probabilidad de A es el numero: 



12 12 

P(A) =-+-+-+-= 
9 9 9 9 



2 

- = 0.667 ■ 
3 



5.4.2 Espacio muestral infinito numerable 



Sea = , un espacio muestral infinito numerable. Entonces, 

se puede expresar fi, como una union disjunta infinita de sus eventos elementales 
(equiprobables o no), esto es, 

q = 0{h-,}. 

i=l 

Utilizando los axiomas P2 y P4) resulta: 



P 



^ 00 ^ 

Uw 



v 1=1 y 



= 2>(K}) = i- 



Luego, si A es un evento de Q , cuyos eventos elementales pueden ser 
equiprobables o no, entonces, 

P(A)= 2>({w,}). 

iv, e A 



EJEMPLO 5.13. 

Un dado se lanza sucesivamente hasta que aparezca el primer uno. 

a) Describa el espacio muestral del experimento y determine la probabilidad de 
cada elemento. 

b) Verificar que P( Q) = 1 
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c) Si dos personas A y B juegan lanzando el dado uno despues del otro y si gana 
el que obtiene el primer uno , calcular la probabilidad de que gane A el juego, si 
el comienza primero. 

SOLUCION. 

a) Sea E (exito), el evento ’’sale uno en la tirada f\ y sea F (fracaso) el evento: no 
sale uno en la tirada i", donde i = 1,2,3, etc. 

El espacio muestral que resulta de lanzar el dado sucesivamente hasta 
obtener un uno se puede escribir como el conjunto: 

Q = [E y FE , FFE , • • • , etc) 



Si Wj = £ , w 2 = FE , w 3 = FFE , etc, entonces, 

*>({"',}) = 7 . P({w 2 }) = f x± P({w 3 }) = 

D DO 



5 Y 1 
.6 J 6 



Resumiendo, paracada i = 1,2,3,... resulta: 



b) Para venficar que P(Q) = 1 , se usa la suma geometrica: 

1 + r + r 2 +--- = — — , si irlcl 
1 — r 1 1 






1 = 1 



= ix— 1— = 1 
6 1-1 . 



c) Si A comienza el juego, entonces, A juega las veces impares 1,3,5,. ..etc., y la 
probabilidad de que gane A es: 



1 if if sV 1 

P(gane A) = — + — — +- - +- 

6 6 \6J 6\6J 6 






+ ... 






P(gane A ) = 



1 + 






3 ^ 

+ ... 

J 



1 1 

= — X 

6 



1 - 



(!) 



6 

2 ~11 
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5.4.3 Espacio muestral continuo. 

Sea A cualquier evento de un espacio muestral continuo Q, tal que la medida 
(longitud o area) de A y m(A) , exista. Entonces, la probabilidad de A es el numero. 



P(A) = 



m(A) 

m(Q) 



EJEMPLO 5.14. 

La demanda de dos productos A y B varfa aleatoriamente en un rango de 1000 a 
5000 kilogramos. El distribuidor decide bajar el precio de venta de ambos 
productos si la suma de sus demandas varfa de 3000 a 5000 Kg. Calcular la 
probabilidad de que el precio de venta de ambos productos baje. 

SOLUCION. 

Sea X: demanda del producto A, Y: demanda del producto B, en miles de 
kilogramos. El espacio muestral Q es el conjunto: 

n = {(x,v)eiR 2 /1<x<5 y l<v<5} 

Si A es el evento " el precio de ambos productos baja“, entonces, en terminos de 
la demanda, 



A = { (jc, y) e Q /3 < x + y < 5} 




En la figura 5.5 se observa que A es la parte sombreada cuya area es: 

. 3x3 lxl 

Area{A) = 4 

2 2 

Por tanto. 
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PiA)= a^i 

area(£l) 



4 

4x4 



= 0.25- 



NOTA. En el caso continuo la probabilidad de un punto en Q es cero. Por lo tanto, 
P(A)=0, no implica A=0. En cambio, si Q es finito, P(A)=0, impliea A=0 



EJERCICIOS RESUELTOS 

EJERCICIO 1. 

Una urna contiene 5 fichas similares de los cuales 3 son de color rojo y 2 de 
color azul. Si de esa uma se extraen al azar 3 Fichas a la vez, calcular la 
probabilidad de que solo una de ellas sea de color rojo: 

a) Listando los elementos, 

b) Sin listar los elementos. 

SOLUCION. 

a) Identifiquemos a las Fichas rojas por R x> R 2 > y /? 3 ,y a las fichas azules por 

A y ^2* 

El espacio muestral Q es el conjunto de todas las ternas de Fichas que se 
pueden extraer, es decir, 

Q={ r } r 2 Ri, a x r x r 2 . a x r x r^, a x r 2 r„, a 2 r x r 2% a 2 r x r^. a 2 r 2 r^ % 

A x A 2 R x , A X A 2 R 2 , A A 2 R^ }• 

Sea A el evento "solo una de las 3 Fichas es de color rojo", entonces. 

A = {A x A 2 R x > A x A 2 R 2y A x A 2 R 3 }. 

La probabilidad de A es el numero: 



n(Q) 10 

b) En la mayoria de las aplicaciones no interesa saber cuales son, si no cuantos 
son los elementos del espacio muestral Q y del evento A. 

En este caso, el numero de elementos del espacio Q es igual al numero de 
formas diferentes de extraer 3 Fichas a la vez de la urna que contiene 5 fichas, es 
decir, 

< 5’ 

CP = C\ = — = 10. 

3 3!2! 



www.FreeLibros.me 



Teona de la probabilidad 



167 



Por otra parte, el numero de elementos del evento A , es igual al numero de 
formas de extraer a la vez 3 fichas de las cuales una es roja y dos son blancas. 
Es decir, 

CF = C 2 2 C, 3 =1x3 = 3. 

Luego, la probabilidad de A es el numero P(A)=CF/CP= 3/10. 



EJERCICIO 2. 

Dos alumnos se distribuyen al azar en 3 computadoras numeradas con 1 , 2 y 3 
respecti vamente. Si ambos pueden estar en una misma computadora, pero ninguno 
en dos computadoras a la vez. 

a) Determine los elementos del espacio muestral. 

b) Calcular la probabilidad de que la computadora 3 no se ocupe. 

SOLUCION. 



Sean los eventos: 

A t : "alumno A en la computadora i. i = 1.2,3" 
B f : "alumno B en la computadora j y j = 1,2,3" 
a) El espacio muestral Q es el conjunto 



Q = { A l B l 9 A l B 29 A i B 39 A 2 B l 9 A 1 a 29 A 2 B 39 AyB l 9 A i B 29 AyB J } 



b) Si C es el evento "la computadora 3 no se ocupa", entonces, 



C = {A } B l ,A l B 29 A 2 B l ,A 2 B 2 ) 



La probabilidad de C es el numero: 



P(C) = 



#(C) 

#(fi) 



4 

9 



Observar que #(Q) = 3x3 = 9 ya que cada alumno puede escoger cualquiera de 
las 3 computadoras. Tambien #(C) = 2x2 = 4. ya que si la numero 3 debe estar 
libre, entonces, cada uno puede escoger cualquiera de las dos que quedan 



NOTA. 

Si la condicion es que los alumnos escojan computadoras diferentes, entonces: 

n = {A l B 29 A l B^A 2 B l ,A 2 B 3 ,AsB l ,A 3 B 2 } 

Tambien el evento C: "la computadora 3 no se ocupa", es 

C = { A^B 2 , >^ 2 ^ 1 ) 
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P(C) = 



#(C) 

#(Q) 



2 

6 



EJERCICIO 3. 

Suponga que una rifa consiste de 1000 boletos En esta rifa un boleto se premia 
con $500, dos con $250, cinco con $100, cien con $5, y los demas no se 
premian. Si se adquiere un boleto de la rifa, calcular la probabilidad de: 

a) ganar alguno de los premios, 

b) ganar a lo mas $ 1 00, 

c) no ganar premio alguno. 

SOLUCION. 

Si suponemos que los boletos estan enumerados de 1 a 1000, entonces, el 
espacio muestral Q que consiste en elegir un boleto al azar es el conjunto: 

Q = {1,2, •••,1000} 

a) Si A es el evento "ganar alguno de los premios", entonces este evento consiste de 

todos los boletos que seran premiados. Es decir, #(A) = 1 + 2 + 5 + 100 = 108 
Luego, la probabilidad de A es el numero: 

P(A) = 108/1000 = 0.108. 

b) Si B es el evento "ganar a lo m&s $100". entonces este evento consiste de todos 

los boletos que se premiaran con $5 y con $100 Es decir. 
#(fi) = 5 + 100 = 105 . Luego, la probabilidad de B es el numero 

P(B) = 105/1000 = 0 105. 

c) Sea C el evento "no ganar premio alguno", entonces este evento consiste de todos 

los boletos que no seran premiados. Es decir, n(C) = 1000 — 108 = 892 
Luego, la probabilidad de C es el numero: 

P(C) = 892/1000 = 0.892. 



EJERCICIO 4. 

Una urna contiene 13 fichas, de las cuales, 6 fichas estan numeradas con 15, 
cuatro numeradas con 10 y tres numeradas con 5. Si de esta urna se escogen 3 
fichas al azar y a la vez, calcular la probabilidad de que 

a) Al menos dos de ellas tengan el mismo numero 

b) La suma de las tres fichas sea 30 
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SOLUCION. 

El numero de elementos del espacio muestral que consiste escoger 3 fichas a la 
vez de 1 3 es: #(Q) = - 286 

a) Si A es el evento;”Al menos 2 de las 3 Fichas tienen el mismo numero”, entonces. 

A c es el evento: “las tres fichas son diferentes”. El numero de elementos de A 1 
es #(A C ) = Cj 6 C| 4 Cj 3 = 72 . Luego, la probabilidad de A es el numero 

P(A) = 1 - P(A C ) = 1 - — = 0.748 
286 

b) Si B es el evento: “la suma de las tres fichas es 30”, entonces, B consiste de una 
ficha numerada con 15, una numerada con 10 y una numerada con 5 o tres 
fichas numeradas con 10. El numero de elementos de B es 

#(B) = C, 6 C, 4 C 1 3 +C 3 4 =76, y 



F(B) = 



#(B) 

#(«) 



76 

286 



= 0.2657 



EJERCICIO 5. 

Una lote consiste de 15 objetos, 7 de los cuales se califican como E (exito) y el 
resto se califican como F (fracaso). Si se escogen 5 objetos al azar, calcular la 
probabilidad de que 3 sean E y 2 sean F, si se escogen: 

a) Uno por uno sin reposicion 

b) Uno por uno con reposicion 

c) Los cinco a la vez 

SOLUCION. 

a) CP = 15 xl4x 13x12x11 = 360360, (CP = Vj 5 ) 

CF = C 3 (7 x 6 x5) x ( 8 x 7) = 117600 , ( CF = C*VjV? ) 



CF 

P(3E y 2F) = 

CP 



117600 

360360 



0.326 



b) CP = 15 x 15x15x15x15 = 15 s , CF = C 3 (7x7x7)x(8x8), 



P(3E y 2F) = 



CF Cj7‘ x 8 2 5 3 2 



donde p = 7/15y # = 8/15 
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r-r v: r 8 

c) CP = Cj S , CF = C 3 7 xCf, F(3£ y 2F) = = 2 2 



CP 



NOTA. El lector deberia verificar que a) y c) dan el mismo resultado 



Esto es. 



clvjv* cjc 



.15 



-15 



EJERCICIOS 



1. Verificar que para los eventos A y B cualesquiera: 

a) P(A-B) = P(A)-P(AB) 

b) P(AB C kj A C B) = P( A) + P(B) - 2 P(AB) . 

2. Si A y B y C son eventos cualesquiera, demostrar que: 

P(AkjB^jC) = P(A) + P(B) + P(C) - P(AB) -P{AC)~ P(BC) + P( ABC) . 

3. Si la probabilidad de que ocurra un evento A es 1/2 y que ocurra un evento B es 

3/4, determine los posibles valores de p— P(Ar\ B ) . 

Rp 0, si A r\ B = 0 . 1/2, si A a B y t/ 4 < p < 1 si A a. B. 

4 . Un sistema esta formado por dos componentes A y B cuyas probabilidades de 
falla son 1/6 y 2/15 respectivamente. Si la probabilidad de que al menos una de 
las dos componentes falle es 7/30, calcular la probabilidad de que: 

a) ninguno de las dos componentes fallen. 

b) solo una de las componentes falle. Rp a) 23/30, b) 1/6 
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5. Un lote contiene n objetos. La probabilidad de que al menos uno sea defectuoso 
es 0.06, mientras que la probabilidad de que al menos dos sean defectuosos es 
0.04. Calcular la probabilidad de que: 

a) todos los objetos sean no defectuosos. 

b) exaetamente un objeto sea defectuoso. Rp. a) 0.94. b) 0.02. 

6. Un monedero contiene monedas de medio sol en numero igual a 4 veccs cl 
numero de monedas de 20 centimos, y contiene monedas de un sol en numero 
igual a 3 veces el numero de monedas de medio sol. Si se elige una moneda al 
azar, calcular la probabilidad de que su valor sea al menos de medio sol. 

Rp. 16/17 

7. Como resultado de la demanda de pasajes, las lfneas aereas nacionales se han 
visto obligadas a aumentar el numero de vuelos. Una comparua determinada 
tiene por el momento 5 vuelos Lima-Iquitos dos de ellos en la manana y los 
otros en la tarde. 

a) ^Cual es la probabilidad de que no haya ningun vuelo en la manana? 

b) Si se cancelan al azar dos de estos vuelos, £cual es la probabilidad de que 
sigan habiendo un vuelo en la manana y dos en la tarde? 

Rp. a) 3/5, b) C^Cl /C* 

8. Una caja contiene 5 fichas de $10 cada una, 3 de $30 cada una y 2 de $50 cada 
una. Si se escogen 3 fichas al azar y a la vez, calcular la probabilidad de que la 
suma de los valores sea de $70. 

Rp. (CjC, 2 +C 3 2 C?)/C\° 

9. Un programador de computadoras debe escoger tres trabajos de entre cinco que 
esperan la atencion del programador. Aunque el programador no lo sabe, los 
trabajos varfan en cuanto al tiempo de programacion que requieren. Defina un 
espacio muestral para este experimento enumerando sus elementos. Dai una 
asignacion de probabilidades adecuada y calcular la probabilidad de que el 
programador escoja los dos trabajos que requieran el menor tiempo. 

Rp. n={ 123, 124, 125, 134, 135. 145, 234, 235, 245, 345}, Prob=3/10 

10 . Doscientas personas estan distribuidas de acuerdo a su sexo y lugar de 
procedencia de la siguiente manera: 130 son hombres, 1 10 son de la capital y 30 
son mujeres y de provincias. Si se eligen dos personas al azar calcular la 
probabilidad de que: 

a) Ambos sean hombres y de provincias. 

b) Al menos uno de los dos escogidos sea mujer. 

O . i- 60 f r- 200 . , ,^70 -130 -70 /- 200 

Rp. a) C 2 /C 2 , b) (C, C, +C 2 )/C 2 
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11. Un lote contiene 8 articulos buenos y 4 defectuosos, si se extraen al azar 3 

artfculos a la vez, calcular la probabilidad de obtener por lo menos un 
defectuoso. Rp.=l-C 0 4 C* /c| 2 

12. Una urna contiene 20 fichas similares de las cuales 10 son rojas, 6 son azules, y 
4 son verdes. Si se extraen 10 Fichas al azar y a la vez, calcular la probabilidad 
de que 

a) cinco fichas sean rojas. 

b) cinco sean rojas, 3 azules; y 2 sean verdes. 



13. Un comerciante tiene 12 unidades de cierto arliculo de los cuales 4 tienen 
algun tipo de defecto. Un cliente pide para comprar 3 de tales artfculos pero que 
no tengan defectos. Si el comerciante escoge al azar y de una sola vez 4 de talcs 
artfculos, ^cual es la probabilidad de que con las 4 unidades escogidas satisfaga 
el pedido del cliente?. 



14. De 6 alumnos de ingenierfa y 4 de ciencias se deben seleccionar dos de ellos 
para hacer cierta tarea, ^cual es la probabilidad de que la seleccion este formada 
por uno de ciencias y otro de ingenierfa si un determmado alumno de ciencias 
no puede hacer pareja con 2 de ingenierfa?. 



15. Un jurado de 7 jueces van a decidir la inocencia o culpabilidad de un reo 
Suponga que 4 votan por inocencia y los otros tres por culpabilidad. Si se 
seleccionan al azar 3 jueces y se pregunta por su voto , ^cual es la probabilidad 
de que la mayorfa de los jueces de la muestra esten a favor de la inocencia del 



16. Una mujer se quejo de discriminacion de parte de una companfa local, por el 
hecho de ser mujer. El jurado que vio el caso estaba formado por 5 mujeres y 3 
hombres y voto 5 a 3 a favor de la demandante. El abogado de la companfa 
apelo alegando parcialidad de los miembros de jurado de acuerdo a su sexo. 
^cual es la probabilidad de que realmente esto haya sido cierto? 





Rp (C? +c?c?)/c' 2 ° . 



reo?. 



Rp. iCfcj' + cfoJj/C, 



5 t N 

Rp. 5M3H, 5/(5+3). Sea 5M cinco mujeres votan a favor P(5Af ) = C 0 j C ^ 
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17. Una caja contienc 16 pernos de los cuales 8 no tienen defectos, 5 tienen defectos 
leves, y 3 lienen defectos graves. Si se eiigen 3 pernos al azar y de una sola vez. 



calcular la probabilidad de que los tres no tengan defectos leves' 

Rp. \-(C*Jc\ b ). 



18. Suponga que 3 alumnos se matriculan al azar en un curso que tiene cinco 

secciones: HI, H2, H3, H4, y H5, pudiendo los tres matricularse en una misma 
seccion. Calcular la probabilidad de que ninguno de ellos se matricule en la 
seccion HI. Rp. 4*/5\ 

19. Una urna contiene doce fichas de las cualcs tres cstan premiadas. Si a una 
persona le toca extraer cinco fichas al azar y a otra persona el resto, ^,cual es la 
probabilidad de que las tres fichas premiadas sean obtenidas por una misma 
persona?. 

Rp. (Cl/c\ 2 )+(Cl / C \ 2 ) =(C 9 2 + C 9 )/c'f . 

20. Se disena un circuito que debe tener 8 resistencias numeradas de 1 a 8 
conectadas en serie. Si se instalan cuatro resistencias de marca A y cuatro de 
marca B, *,cual es la probabilidad de que las cuatro resistencias de marca A 

a) ocupen las cuatro primeras posiciones?. 

b) esten siempre juntas? Rp. a) 4!x4!/8!, b) 5!x4!/8' 

21. Cien personas fueron encuestadas acerca de sus preferencias sobre ires 
productos A, B, y C. Se encontro que 50 prefieren el A, 37 el B, y 30 el C. 
Ademas 12 prefieren A y B, 8 solo A y C, 5 solo B y C, y 15 solo C. De cinco 
personas encuestadas elegidas al azar, calcular la probabilidad de que 2 de ellas 
prefieran B y C, 2 solo A y B, y una prefiera los tres productos 

r p . cic' b c 2 /cr 

22. En una produccion de 10,000 articulos , 1,000 de eslos pueden tener al menos 
uno de 3 tipos de defectos A, B y C de la siguiente manera 650 de A, 372 de B, 
590 de C, 166 de A y B, 434 de A y C, 126 de B y C. Si un artfculo de esta 
produccion es elegido al azar, calcular la probabilidad de que tenga, 

a) los 3 tipos de defectos, b) solo un tipo de defecto. 

Rp. a) 0.0114, b) 0.0502. 

23. Un dado normal se tira cinco veces, calcular la probabilidad de obtener: 
a) todos los resultados diferentes, b) al menos dos resultados iguales. 

Rp. a) V 5 6 /6 5 . b) I-Wf/e 5 ) 
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24. Calcular la probabilidad de que de 5 personas por lo menos dos de ellas hayan 
nacido el mismo dia de la semana (la solution similar al del problema 23). 

r p . i- v; it 



25. Se selecciona al azar un numero de los numeros, 0,1, 2,3 999, calcular la 

probabilidad de que el numero no sea divisible ni por tres ni por siete. 

Rp. 0 572. 

26. En el control de calidad de un articulo la probabilidad de que se encuentren por 

lo menos ocho articulos defectuosos es 0.15 y de que se encuentren a lo mas 4 
articulos defectuosos es 0.50, ^cual es la probabilidad de que se encuentren 5. 6, 
7 articulos defectuosos en el control?. Rp. 0.35. 



27. Una urna contiene 3 bolas numeradas de 1 a 3. Las bolas se sacan al azar una a 
una sin reposition. Si se considera un exito cuando la bola k sale en la 
extraction k, k= 1,2,3, 

a) describa el espacio muestral 

b) calcule la probabilidad de obtener al menos un exito 

Rp. a) £2={EEE. EFF, FEE. FFF. FFF, FEF}, b) 2/3. 



28. Se va a seleccionar a 3 alumnos de 10 alumnos candidatos compuesto de 7 
hombres y 3 mujeres para una determinada tarea. El seleccionador no sabe que 
los 10 alumnos estan calificados de 1 a 10 segun su eficiencia en esa tarea. 
Calcular la probabilidad de que la terna contenga 

a) uno de los 2 mejores y dos de los 3 peores candidatos. 

b) Por lo menos una mujer 



Rp. a) C, 2 C* / Cj u . b) I cj_.c* /<f =1- c] C* / c'° 
1=1 ’ / 



29. Los valores de 5 acciones diferentes en la bolsa son: 1,2,3,4,5 dolares 
respectivamente. Se eligen 3 acciones al azar de una en una sin restitution. 
Hallar la probabilidad de que la action de mayor precio obtenida exceda la 
accion de menor precio por lo menos en 3$ 

Rp. CP=5x4x3=60, CF=42, minimo I y maximo 4 6 5 son 30 casos. minimo 2 y maximo 5 

son 1 2 casos. prob. = 42/60 = 0.7 



30. Una empresa ha hecho un pedido de 20 “discos duros” que deben ser enviadas 
a tres de sus sucursales A, B y C. de manera que A reciba 8, B reciba 7 y C 
reciba 5. Se sabe que 3 de tales discos no han sido “formateados”. Si la 
asignacion se hace en forma aleatroria, ^que probabilidad hay de que los tres 
discos no formateados sean enviados a la misma sucursal?. 

Rp. (C'JC \ 2 +C* 7 C» + C\ 7 Cl 5 )/C 20 c \ 2 
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31. Los resultados de un experimento aleatorio caen en el intervalo [a, b], a <b. 
para cada intervalo A contenido en [a, b], definimos la probabilidad de A por: 

P(A) = iongitud de A/(b-ci), 
pruebe que P es una probabilidad. 

32. El precio de un bien A puede tomar cualquier valor entre 0 y 6 soles, nnentras 
que el precio de un bien B puede tomar cualquier valor entre 0 y 12 soles. Si 
usted esta dispuesto a gastar mas de 6 soles comprando tales bienes, calcule la 
probabilidad de que pueda comprar de 2 unidades de A y 3 unidades de B. 

Rp. n={(jt.)0/0<x<6. 0<v<12}. a) A=l(.v,v)eQ)/ 2v+3y>6}. P(A)=\ - [(2x3)/2}=2/3. 



33. Un segmento de Iongitud 10 se divide en 3 segmentos. Calcular la probabilidad 
de que con tales segmentos se pueda construir un triangulo, sabiendo que la 
suma de las longitudes de dos lados es mayor o igual que la Iongitud del tercero. 

Rp. 1/8. 

34. Dos gerentes deciden encontrarse en cierto lugar para cerrar un negocio entre 

las 8 p.m y las 9 p.m de una dfa determinado. Si convienen que cada uno de 
ellos debe esperar al otro a lo mas 10 minutos, ^cual es la probabilidad de que se 
encuentren? Rp. A={(jc.y)en/|jc-y|<iO}. P(A)=\\/36. 

35. La demanda de cada uno de dos artfculos A y B varfa aleatoria e indistintamente 
en un rango de 2000 a 10000 toneladas. Se acuerda de bajar el precio de venta 
de ambos artfculos, si la suma de sus demandas supera las 5000 toneladas, pero 
no es mayor de 7000 toneladas. ^Cual serfa la probabilidad de que el precio de 
venta de ambos artfculos baje? 

Rp. Q - { (*, v) / 2<x< 1 0, 2<y<10}. A {(x,v)eQ)/5<i+v<7}. P(A)=4/64=1/I6 



36. Un sistema esta formado por dos componentes electronicas cuyas duraciones 
varfan aleatoriamente e indistintamente entre 0 y 5 anos, pero la segunda 
componente actua como respaldo de la primera tan solo cuando la primera deja 
de funcionar. Si la primera componte tiene mayor duracion, calcular la 
probabilidad de que esta dure dos o mas anos que la segunda. 

Rp. n=triangulo: (0,0), (5,0), (5,5), A={(A,v)eQ)/jc>y+2}, P( A)=(3x3/2)/ (5x5/2)=9/25 



37. Suponga que el precio P de un galon que un industrial fijara durante la semana 
siguiente para la venta de su solvente podrfa tomar indistintamente valores 
entre 10 soles y 20 soles. Un estudio ha revelado que la demanda semanal del 
solvente puede tambien tomar indistintamente valores entre 400 -5 P galones y 
los 1000 galones, ^,Con que probabilidad el solvente tendra durante la siguiente 
semana una demanda inferior a los 600 galones? 

Rp. (255+ 250)/(255+250+4000)=2750/6750, 
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5.5 Probabilidad condicional 

A menudo se quiere determinar la probabilidad de que ocurra un evento 
sabiendo que otro evento ha ocurrido. La probabilidad condicional (o condicionada) 
de que un evento B ocurra dado que otro evento A ha ocurrido se denota por 
P(B! A) . Esta notation se lee “la probabilidad de que B ocurra dado que A ha 
ocurrido” o simplemente “la probabilidad de B dado A” 

Definition. Sean A y B dos eventos en un espacio muestral. La probabilidad 
condicional de B dado A , es el numero P(B / A) que se define por: 

P(B/a)= P( - Ar)B \ si P( A)> o 



NOTAS. 

1. Si P( A) = 0 , se define P(5/A) = 0. 

2. Observar que (AnB)c A, luego, cada vez que se calcula P(B/A) estamos 
realmente calculando P(B) con respecto al espacio muestral reducido A. Por 
esto, P{B/A) se interpreta tambien como la actualizacion de P(B) cuando el 
evento A ha ocurrido. 

3. En particular, si A y B son dos eventos de un espacio muestral finito 
equi probable Q , la probabilidad condicional de B dado A, se calcula por 

P(B/A)=— An ' B ^ , si #( A) > 0 
#(A) 

4. Si An 5 = 0, entonces, P(B/A) = 0 

5. Si A a B , entonces, P(BI A) = P(A/ A) = 1 

6. Si Bcz A, entonces, P(B/ A) = . 

P(A) 

EJEMPLO 5.15. 

Un club consiste de ciento cincuenta miembros. Del total, 3/5 son hombres y 2/3 
son profesionales. Ademas, 1/3 de las mujeres son no profesionales. 

a) Se elige al azar un socio del club: 

al) Calcular la probabilidad de que sea hombre y profesional. 

a2) Calcular la probabilidad de que sea hombre, dado que es profesional 

b) Se eligen tres socios al azar: 
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bl) Si ias tres son mujeres, *,cual es la probabilidad de que al menos una de ellas 
sea profesional? 

b2) Si resultan ser del mismo sexo, ^.eual es la probabilidad de que sean 
mujeres?. 

SOLUCION. 

El espacio muestral Q consiste de los 150 miembros del club que son 
clasificados en: Hombre (//), Mujer(Af), Profesional (P), y No profesional (AO, 
segun la tabla5.1 



Tabla 5.1 





Profesional (P) 


No profesional (AO 


Total 


Hombre (//) 


60 


30 


90 


Mujer (Af) 


40 


20 


60 


Total 


100 


50 


150 



a) Si se elige un socio al azar 



al) P(H nP) = 



#(//nP) 

#(Q) 




a2) Considerando el espacio muestral reducido P , tenemos. 



P{H/P) = 



#(// n P) 
#(P) 




Tambien, usando la definicion de probabilidad condicional, tenemos. 



/>(////>)= 



P(H n P) 
P(P) 



60/150 

; = 0.6 

100/150 



b) Si se eligen tres socios al azar 

bl) Sean los eventos A las tres son mujeres" y B :"al menos 
profesional" . 

Considerando el espacio muestral reducido A se tiene, 



una es 



P(B/ A) = 



#t Anfi) 
#(*) 



40 20 40 20 /o 40 20 40 ^ 20 

Cj t '-i t C3 Cq Cq ^3 



C3 



60 



-.60 



b2) Sean los eventos A los tres son del mismo sexo" y B :"las 3 son mujeres" 
. Observar que el evento A es "los tres son H o las tres son A/", y 
que B a A , luego B r\ A = B . Entonces, 



#(A) = C?° + Cf = 1 51.700, y #(B) = Cj 00 = 34,220 



-60 



60 



Considerando el espacio muestral reducido A , se tiene, 
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#(B) = 34,220 _^ Q23 
#(A) 151,700 

NOTA. El lector deberfa verificar que para eventos en Q : A (fijo) y B 
(cualquiera), la probabilidad condicional P(B/A), satisface los diversos 
postulados de probabilidad. Esto es, 

a) P(B I A) satisface los axiomas de la probabilidad: 

1) P(B/A)>0 para todo evento B 

2) P{n/A) = 1 

3) Si B { y B 2 son eventos que se excluyen mutuamente, entonces, 

P((£, vB 2 )/A) = P(B } / A) + P{B 2 / A) 

b) P(B/ A) satisface los teoremas de probabilidad, entre otros, 

1) P(0f A) = 0 

2) P(B C /A) = X-P(BIA). 

3) Si B x y B 2 son dos eventos cualesquiera, entonces, 

P((B, kjB 2 )/ A) = P(B i /A) + P(B 2 /A)-P((B ] i~\B 2 )/ A) 

5.6 Eventos independientes 

Definition 1. Se dice que el evento B es independiente (estadisticamente o 
estocasticamente o via probabilidad) del evento A, si, 

P(B / A) - P(B). 

Se verifica que, si P(B/A)=P(B ), entonces, P(A/ B)= P(A) y 

reciprocamente. En consecuencia, podemos afirmar que: 

Los eventos Ay B son independientes si, y solo si, 

P(B/ A)=P(B) y P(A/B)=P(A). 

Esto equivale a decir que Ay B son eventos independientes si y solo si 

P(AnB) = P( A) P(B). 

Este resultado es con frecuencia utilizado como la definition de dos eventos 
independientes por su aplicacion practica. Establecemos la siguiente 
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Definition 2. Dos eventos Ay B son independientes si y solo si 

P(Anfi) = P(A)P(B). 

De otra forma Ay B son dependientes. 

NOTA. A y B independientes no significa Ar\ B = 0. 

EJEMPLO 5.16 

Un dado se lanza 2 veces, 

a) Si A es el evento "sale 2 en el primer lanzamiento", y si B es el evento "sale 5 en 

el segundo lanzamiento", son Ay B independientes?. 

b) Calcular la probabilidad de obtener los numeros 2 y 5. 

SOLUCION. 

El espacio muestral del experimento de lanzar un dado 2 veces es el conjunto 
& = {(ij)fij = 1,23,4,5,6} . 

a) El evento A :" sale 2 en el primer lanzamiento" es el conjunto: 

A = {(2>j)/ j = 1,23,4,5,6} 

El evento B : "sale 5 en el segundo lanzamiento" es, 

B - {(i\5)/i = 1,2,3,4,5,6) . 

Ademas, el evento A n Z? = {(2,5)} . 

Entonces, 

P(A) = 1/6, P(B) = 1/6, P(AnB) = 1/36, P(A/B) = 1/6, P(B/A) = 1/6. 

Por consiguiente, los eventos A y B son independientes ya sea por que, 

P(B/A) = P(B) y P(A/B) = P(A ) , 
o por que, P(A n B) = P(A)P(B ) . 

b) Sean los eventos A i : "sale 2 en la tirada /", i = 1, 2, y B f "sale 5 en la 
tirada i", i = 1,2, entonces el evento C "sale los numeros 2 y 5 ", es, 

C = A, nfi 2 u n A 2 . 

Luego, 

P(C) = pm, )P(B 2 ) + P(B, )P(/\ 2 ) = X 1 + 1 X i = .1 • 

6 6 6 6 36 

Observar tambien que. 
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CP =# (Q) - 36, A - { (2,5), (5,2) } , CF =#(A) = 2, 




TEOREMA 5.5. 

Si los evento A y B son independientes, entonces: 

a) A y B° son independientes, 

b) A c y B son independientes, 

c) A c y B c son independientes. 



PRUEBA. 

a) Se puede escribir el evento A como una union disjunta (figura 5.6) de la forma 
A-AB^u AB C . 



Ademas, por hipdtesis, P(AB) = P( A ) P( B ) . En consecuencia, 
P(AB C ) = P(A)- P( A)P(B) = P(A)(1 - P(fi)) = P(A)P(B C )- 



EJEMPLO 5.17 

Suponga que en un proceso de produccion se utilizan las maquinas, 1 y 2, que 
trabajan en forma independiente para producir cierto bien. Si la probabilidad de que 
ambas maquinas fallen es 1/5 y de que falle solo la 2 es 2/15. Calcular la 
probabilidad deque 

a) falle solo la maquina 1. 

b) la produccion continue. 




Figura 5.6 



Luego, P(A)= P(Afi)+ P(AB C ). 



Para probar b), use la identidad: B = AB^J A c B 

Para probar c), use por ejemplo, la identidad: Q = B kj AB c kj A c B c 
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SOLUCION. 

Sean los eventos: A: "falla la maquina 1", y B: "falla la maquina 2", entonces, 
P(A nB) = 1/5 = 3/15, P(A C nB) = 2/ 15, entonces, P(B) = 5/15 
Ademasde P(A n B) = P(A)P(B) , resulta, P(A) = 9/15 

a) P(AB C ) = P(A)P(B C ) = — x— = — 

15 15 15 

b) P(A C B u u A c fl c ) = P(A C B) + + P{A C B C ) 

= P(A C )P(B) + P{A)P{B C ) + P(A C )P(B C ) 

__6 _5_ _9_ 10 _6 1012 

_ 15 X 15 + 15 X 15 + 15 >< 15~15' 

Observar tambien que, 

P(prod continue)=l-P(prod no continued 1 - P(AB) = 1 - P(A)P(B) = 12/15 . 

Definition. Diremos que tres eventos A, B y C son independientes si, y solo si, 
verifican las relaciones: 

P(A<^B) = P(A)P(B) 

mnC) = W(C), 

P(BnC) = P(B)P(C) 

P(Ar^BnC) = P( A)P(B)P(C). 

Observar que si, solo se verifica: P( A n B n C) = P(A)P(B)P(C) no se 

puede concluir que los eventos A, B, C sean independientes. 

En general, se dice que la sucesion finita de n eventos A x A n , son 

independientes si, y solo si, la probabilidad de la interseccion de dos, de tres, ..., de 
ft - 1 cualesquiera y de los n eventos, es igual al producto de las probabilidades 
de los dos, de los tres, ..., de los ft — 1 y de los n. El total de relaciones que se 
verifican es: 

C n +C n + ... + C" = 2 n -C n -C n = 2 n -ft- 1. 

2 3 n 0 1 



www.FreeLibros.me 



182 



Esiadisticci 



5.7 Reglas de la multiplicacion 

TEOREMA 5.6 

a) P(A^B) = P(A)P(b), si A y B son dos eventos independientes 
P(A r\ B) = P(A)P(B/ A) , si Z? depende de A. 

(La segunda proviene de la definition de probabilidad condicionada) 

b) En general, si A } , A 2 ,***, A n son n eventos, entonces, 

P{A X nA 2 n...n A n )^ P(A i )P(A 2 )...P(A n ) 

si los eventos son independientes. 

P(A l r\A 2 r\...r\A n ) = P(A i )P(A 2 /A ] )P{A 3 /A ] nA 2 }.P{A n /A ] nA 2 ). 

si los eventos son dependientes, y siempre que P(A X r\ A 2 r\ ..-A n _ x ) > 0 . 

La pruebas (por induction) se dejan como ejercicios para el lector. 



NOTAS. 

1) Si los eventos son independientes, entonces, 

P(A, n A 2 r\...nA„) = P(A ] )P(A 2 )...P(A n ) 

Por contraposition en b) , si, 

P(A y r\A 2 r\...r\A n )* P(A } )P(A 2 )...P(A n ). 



entonces los n eventos A, , A 2 , • • • , A n no son mdependientes. 
2) Si los n eventos A, , A 2 , • * * , A n son independientes, entonces. 



Ik 

V 1=] 



f n 



= \-P 



rw =i-n p (A c ) 



Vi= 1 



i=l 



EJEMPLO 5.18 

Un lote contiene 15 objetos de los cuales 7 son calificados como E (exito) v el 
resto como F (fracasos). Del lote se escogen 5 objetos al azar una tras otra, calcular 
la probabilidad de que los cinco sean exitos, si las extracciones se hacen: 

a) con reposicion, 

b) sin reposicion. 
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SOLUCION. 

Sean los eventos: 

E i : “sale objeto defectuoso en la extraccion i”, i = 1,2, 3,4,5. 

F ( : “sale objeto bueno en la extraccion f\ i = 1,2,3, 4,5. 

Si A es el evento "los 5 objetos sustrafdos sucesivamente son exitos", entonces, 
A = £j n E 2 r\ E 3 n F 4 r\ E 5 = E } E 2 E^E 4 E 5 

a) Si las extracciones son con reposicion los eventos son independientes, entonces, 

P(A ) = P(E, )P(E ' )/>(£, )P(£ 4 ) = — x — x — x — x — 

1 - 3 4 15 15 15 15 15 

b) Si las extracciones son sin reposicidn los eventos son dependientes, entonces, 

P(A) = P(E l ) P(E 2 /£, )P{E, /£, E 2 )P(E 4 /£, E 2 E,)p(E 5 /E } E 2 E,E a \ 



D/A . 7 6 5 4 3 

r(i4) = — x — x — x — x — . 

15 14 13 12 11 



Observar que en este caso: 



P(A) = 



7x6x5x4x3 V 5 7 

15x14xI3x12x11~V/ 5 15 



EJEMPLO 5.19 

Con referencia al ejemplo 5.18, si se escogen 5 objetos al azar, calcular la 
probabilidad de que tres sean exitos (y dos sean fracasos), si se escogen, 

a) uno por uno con reposicion, 

b) uno por uno sin reposicion, 

SOLLCION. 

Sea el evento, C: "tres E y dos F . 

Un evento del evento compuesto C es EEEFF cuya probabilidad es: 



Caso a) 



r>/T?z?irrr\ 7 7 7 8 8 ^ *> 

P(EEEFF) = — x — x — x — x — -= p q , 

15 15 15 15 15 

donde p = 7/15, q~ 8/15. 



Caso b) 



v'rrrvrcs 7 6 5 8 7 

P( EEEFF) — — x — x x — x — = — — — 

15 14 13 12 11 V' 5 
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Todos los eventos de C, se obtienen ordenando EEEFF de C 3 =10 formas. Las 



probabilidades de cada una de estas formas son iguales a p*q 2 en el caso a), y a 
V 3 7 V 2 8 / V 5 15 en el caso b). Por tanto, la probabilidad de C es: 



Caso a) 
Caso b) 



P(C) = Cj q 1 , donde p = 7/15, ^ = 8/15 . 



P(C)~Cl 



5 V 3 7 V; 



NOTA. Si los cinco objetos se escogen a la vez, entonces, P(C) = 



c 3 7 c| 

^15 



El lector debena verificar que : 



c|v 3 7 v 2 8 c\?cf 



,15 



.15 



NOTA. En general, la probabilidad de obtener k exitos (F) ( rc - k fracasos (F)) al 
escoger n objetos uno por uno sin reposicion de un lote de N objetos de los cuales 
r son exitos y el resto fracasos es igual al numero: 



cy:v N -*lv m =c[c N ~, r /c N 

k K n - k / n k n - k I n 



EJEMPLO 5.20 

Un experimento aleatorio consiste en la realizacion consecutiva de pruebas 
independientes, donde el'resultado de cada prueba es un exito (E) con probabilidad 

p, o un no exito ( E c ) con probabilidad 1 — p . 

a) Calcular la probabilidad de que ocurra al menos un exito en n pruebas ( n > 1 ). 

b) Si p~ 0.99, 6 cuantas pruebas deberfan realizarse para tener al menos un exito 
con probabilidad 0.9999?. 

c) ^Cual es la probabilidad de que el primer exito en la k-6 sima prueba ( k > 1 )? 

d) ^Cual es la probabilidad de que ocurran k exitos n pruebas {k <n)l. 

e) ^Cual es la probabilidad de que ocurran k exitos en n pruebas, de manera que 
ocurra el &-esimo exito en la n-esima prueba ( k < n . )? 

SOLUCION. 

Sean los eventos: 

E t : "ocurre exito en la prueba i", i = 1 , 2 
E c t : "no ocurre exito en la prueba i = 1,2 

a) Si A es el evento "ocurre al menos un exito en las n pruebas", entonces. 
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*=U £ .’ y m) = p[J £ - ={ ~ p U £ - 



i=i y 



-i-pf)* 



-i-n%)=i“fi(i-p)“i-(i-p)- 



Luego, 



P(A) = \-(\-p) n 



b) P(A) = 1 - (1 - p) n = 0.9999 , entonces, (0.01)" = 0.0001 , n = 2. 

c) P(lerexito en prueba/c) — q k ~ x p 

d) Si B es el evento: "ocurren k exitos en n pruebas", entonces, B consiste de C' 1 
eventos que contienen cada uno, k exitos (£) y n-k no exitos ( E c ), luego. 

p(B)=c n k p k {\-pr k 

Esta probabilidad se denomina probabilidad binomial 

e) Sea el evento D : "ocurren k exitos en n pruebas, de manera que el k-c simo exito 
sea la n-esima prueba El ultimo es un exito, en las restantes ocurre una 
binomial. Luego, 

P(D) = C^Z\ p k q nk 



EJEMPLO 5.21. 

Para decidir si se accpta o no un lote de 20 articulos en donde existen 4 
defectuosos, se toman dos articulos al azar y a la vez. Si los dos son defectuosos se 
rechaza el lote, si los dos son buenos se acepta el lote y si solamente uno es bueno 
se toman otros dos articulos al azar a la vez de los 18 que quedan. Esta vez, si 
alguno es bueno se acepta el lote. de otro modo se rechaza. Calcular la probabilidad 
de aceptar el lote. 

SOLUCION 



P( aceptar el lote) = P(BB) + P(BD)xP[(BD o BB) /BD] 



P(aceptar el lote) = — |r-+ 



c, 4 c , 16 f cfc , 15 



c? 



-.13 \ 



c; 



2 J 



932 

969 



= 0.962 



Observar que: P[Aceptar] = I - P[Rechazar] 

ci c, 4 c ; 6 
cf + c, 2 " 



C 3 c 15 



= i- 



37 

969 
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EJEMPLO 5.22 

Un lote contiene 40 articulos de los cuales 4 son defectuosos y 36 son no 
defectuosos. Si se divide al azar el lote en cuatro sublotes de 10 articulos cada uno, 
calcular la probabilidad de que en cada subiote haya un artfculo defectuoso. 

SOLUCION. 



Sean los eventos :”E1 lote i contiene un defectuoso", i = 1,2,3,4 
y sea A: "Los cuatro sublotes contienen un artfculo defectuoso cada uno", entonces, 
A = Aj A 2 A 3 A 4 y 

P(A) = m, A 2 A 3 A 4 )= P( a, )/>(a /a 2 )p(a 3 /a { a 2 )p(a 4 I a, a 2 a 3 ) 



P(A) = 



4 36 

~40 

c 10 



r 3 r 27 

30 

C 10 



/^1 /-<9 

x xi' u 9_ 



r 20 

C 10 



^10 

C 10 



4!x36!/9! 4 

40/10! 4 



Tambien observar que: 
CP = P A 



40 



_ 40! 

10 * 10 ’ 1010 ”lO! 7, 



CF=4'P 9 3 999 = 



4tx36! 

9! 4 



CF 4!x36!/9! 4 
CP 4 0</l0! 4 



5.8 Regia de la probabilidad total y regia de 
Bayes 

5.8.1 Particion del espacio muestral 

Definition. Se denomina particion del espacio muestral Q , a una coleccion de k 
eventos A i ,A 29 ...yA k que sean mutuamente excluyentes y cuya union es el 
espacio muestral Q , es decir, tales que verifican las siguientes condiciones: 

1) P(A t )> 0, para cada 1=1,2,..., ft 

2) A i oAj=0 Vi * j 

k k 

3) o^P(A) = 1 

j~l i*l 



www.FreeLibros.me 



Teona de la probabilidad 



187 




5.8.2 Regia de la probabilidad total y regia de 
Bayes 

TEOREMA 5.7. (Regia de la probabilidad total). 

Si k eventos: A x , A k , constituyen una particion del espacio muesual 
Q , entonces, para cualquier evento fien Q, 

k 

/>(£) = ]T PM, )/>( am,). 

i=1 

PRUEBA. 

Para cualquier evento B de Q (figura 5 7) 



( k 



B = B r\Q = B r\ 



Ua =U< Bn A>- 



Vf=l 



/=! 



Ademas, los eventos B r\ A t , i = 1,2, k . son excluyentes dos a dos. Luego, 

por el axioma P3), se tiene: 

k k 

P(B) = £ P(A, nB) = Y J PiA l )P(Bi A , ) 

/=! i=l 
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TEOREMA 5.8. (Regia de Bayes). 

Si los k evemos: A, , A 2 A k , constituyen una partition del espacio muestral 
Q , entonces, para cualquier evento B de fi tal que P(B)> 0, 



P(A i /B) = 



P(A,)P(fi/A,.) 

P(B) 



paracada / = 1,2, — A: 



PRUEBA. 

Para cualquier evento A, de la partition, se tiene: 



P{A,/B) = 



P(A i n B) 

P(B) 



PjAJPjB/Aj) 

P(B) 



donde P(B) = ^P(A i )P(B/A i )- 

i=l 

La regia de Bayes nos permite comparar la probabilidad previa (o apriori ) 
P(A S ) con la probabilidad posterior (o aposteriori) P(A./fi). Esto es, 
P(AjB) es la probabilidad de A t corregida o modiflcada por la ocurrencia del 
evento B. 

Observar que la regia de Bayes da el porcentaje de la contribucion de 
P(A t n B) con respecto a P(B). 



EJEMPLO 5.23 

Un ensamblador de computadoras usa partes que provienen de tres proveedores 
P x , P 2 y P 3 . De 2000 partes recibidas 1000 provienen de P x , 600 de P 0 y el resto 
de P 3 . De experiencias pasadas, el ensamblador sabe que las partes defectuosas que 
provienen de P x , P 2 y P 3 son respectivamente 3%, 4%, y 5%. Si se elige una 
computadora al azar, 

a) ^Cual es la probabilidad de que contenga una parte defectuosa? 

b) y si contiene una parte defectuosa, ^cual es la probabilidad de que haya sido 
provefdo por P 2 ?. 

SOLUCION. 

Sean los eventos: 

A, : "Parte proviene del proveedor P ( ", i = 1,2,3. 

B: "Parte defectuosa". 

Las probabilidades, P(A,), P(B!A t ) se ubican en el diagrama que siguei 
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donde 



P(A,) = -^=0.5, P{A 2 ) = 60 ^ = 0-3, P(A,)= 400 - = 0.2 
1 2000 2 2000 2000 



P(£M,) = 0.03, P(B/A 2 ) = 0.04, P(B/A 3 ) = 0.05 



0.03 



P(A,)P(B/A,) 




a) Aplicando la regia de la probabilidad total, se obtiene, 

P(B) = P(/4, )P(B/A l ) + P(A 2 )P(B/A 2 ) + P(A 3 )P(B/A 3 ) 
P(B) = 0.5 x 0.03 + 0.3 x 0.04 + 0.2 x 0.05 = 0.037 . 

b) Aplicando la regia de Bayes, se obtiene, 

_ 0-3 > 0 04 = 0 3243 
P{B) 0.037 



EJEMPLO 5.24 

En un dia cualquiera cuatro maquinas M, , M 2 , M 3 y M 4 producen un bien de 
consumo en las siguientes proporciones: M ] produce el doble de M 4 , M 3 
produce el triple de M 4 , mientras que M ] produce la mitad de M 0 . Las 
producciones no defectuosas son respectivamente 95%, 95%, 90% para M , , M ^ , 
A/ 3 . Si se elige al azar un articulo de la produccion de un dia y se encuentra que la 
probabilidad de que resulte no defectuoso es 0.93 

a) ^Cual es el porcentaje de produccion no defectuosa de A/ 4 ?. 

b) ^De que maquina es mas probable que provenga un articulo defectuoso?. 

SOLUCION. 

Sean los eventos: 
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A t : "el artfculo exirafdo es producido por la maquina M. ", *=1, 2,3.4. 

B : "el artfculo extrafdo es no defectuoso". 

Si #(>\ 4 ) = x , entonces, #(/\, ) = 2x , #(/\ 3 ) = 3x , #(A 2 ) = 4x, 

Ademas, #(Q) = IOjc . 

Por 1o tanto, 

P(A ] ) = 2/10 , P(A 2 ) = 4/10 , P(A 3 ) = 3/10,P(4 4 ) = 1/10 
P(B/ ) = 0.95 , P(B/A 2 ) = 0.95, P(P/A 3 ) = 0.90 

a) Apiicando la regia de la probabilidad total, se tiene, 

P{B) = P(A [ )P(B/A l ) + P{A 2 )P(B/A 2 ) + P{A 3 )P{B/A 3 )+P(A 4 )P(B/A 4 ) 

P(B) = 0.2 x 0.95 + 0.4 x 0.95 + 0.3 x 0.90 + 0. 1 x P(B / A 4 ) = 0.93 
Luego, P(B/ A 4 ) = 0.90 

b) La probabilidad de produccion defectuosa es: 

P(B C ) = 0.2x0.05 + 0.4x0.05 + 0.3x0. 10 + 0.1x0.10 = 0.0.7 

Apiicando la regia de Bayes para cada A , , i = 1, 2,3,4 , resulta que 
P(A 3 !B c ) = 0.03/0.07 es mayor que el resto. Por lo tanto, si el artfculo 
escogido al azar es defectuoso, es mas probable que provenga de la produccion 
de la maquina M 3 . 



EJERCICIOS RESUELTOS 



EJERCICIO 1 

Las probabilidades de que los socios S } y S 2 sean elegidos presidente de su 
club son respectivamente 0.4 y 0.6. Las probabilidades de que se aumenten las 
cuotas mensuales de los socios son de 0.9 si sale elegido 5, y de 0.2 si sale elegido 
S 2 y 

a) <Cual es la probabilidad de que haya un aumento en las cuotas mensuales de los 
socios?. 

b) Si se aumenta la cuota mensual, <conio se modifican las probabilidades de que 
salgan elegidos los socios S x y S 2 ?. 
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SOLUCION. 

Sean los eventos: 

A ( : "Sale elegido socio S t ", i =1, 2, y 
B : "Se incrementan las cuotas mensuales de los socios". 

Las probabilidades: 

PM, ) = 0.4 . PM 2 ) = 0.6, P(B/A ] ) = 0.9, P(BIA 2 ) = 0.2 
se representan en el diagrama de arbol que sigue: 

Por tanto, 

a) P( B) = P( A, )P(P/A, ) + P( A 2 )P( P/A 2 ) = 0.4 x 0.9 + 0.6 x 0.2 = 0.48. 




' P(B) 0.48 

P{A 2 )P(B/A 2 ) (0.6K0.2) 

P(P) 0.48 

La probabilidad de A, se modifica de 0.4 a 0.75 y la de A ? de 0.6 a 0.25. 

En consecuencia, se puede concluir que, si se aumentan las cuotas mensuales. 
probablemente el socio S 2 no sea elegido presidente de su club. 

EJERCICIO 2. 

Se estima que la probabilidad de que una companfa B tenga exito al 
comercializar un producto es de 0.95 si su competidora la companfa A no interviene 
en el mercado, y es de 0. 15 si la Cfa. A interviene en el mercado. Si se estima que A 
intervendria en el mercado con probabilidad de 0.7 . 

a) ^.Cual es la probabilidad de que la Cfa. B tenga exito? 

b) Si la companfa B no tuviera exito, ^en cuanto se estima la probabilidad de que A 
intervenga en el mercado? 



Pi A 2 /B) 
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SOLUCION. 

Sean los eventos B : "la Cfa. B tiene exito" y A: "la Cfa. A interviene en el 
mercado”. Las probabilidades: 

P(A) = 0.7 , P(A C ) = 0.3, P(B/A) = 0.15, P(£M C ) = 0.95, 

P(B r / A) - 0.85 , P(B C /A c ) = 0.05 

se representan en el siguiente diagrama de arbol. 

For tanto, 

a) P(B) = P(A)P(B/A ) + P(A C )P(B/A C ) = 0.7 x 0. 15 + 0.3 x 0.95 = 0.39 . 



b) P(B L ) = P(A)P(B l /A) + P(A C )P(B l /A c ) = 0.7 x 0.85 + 0.3 x 0.05 - 0.61 



Si B no tuviera exito, la probabilidad dc quc A intervenga en el mercado es: 



EJERCICIO 3. 

En un proceso de produccion se sabe que durante cuatro decimas partes de 
tiempo se producen 20% de unidades defectuosas y durante seis decimas partes de 
tiempo se producen 15% de unidades defectuosas. De la produccion que consiste de 
20 unidades de solo una de las modalidades, se inspeccionan tres elegidos al azar a 
la vez y se encuentran dos unidades defectuosa. En base a este resultado, ^que 
modificaciones acerca de las probabilidades de las dos calidades de produccion se 
deben hacer?. 

SOLUCION. 

Sean los eventos 

A x : “calidad del 20% defectuoso”. 




P(A/B C ) = 



P(A)P(B C /A) _ 0.7 x 0.85 
P(B C ) ~ 0.61 
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A 2 : “calidad del 15% defectuoso’\ y 
B : “dos defectuosos en la muestra de tres”. 



Entonces: 



7^) = 0.4, P(A 2 ) = 0.6. 



P(B/ A ] ) = ClC l 16 /Cf y P(BI A 1 ) = CIC\ 1 /Cf 
P(B) = 0.4 C2 C, 16 / C 3 20 + 0.6 Clcl 1 /C 3 20 = 69/1 140 ■ 

P(AjB) = 38.4 69 = 0.56 y P( A 2 /B) = 30.6/69 = 0.44- 



La calidad del 20% defectuoso tiene probabilidad corregida igual a 0.56, 
mientras que la calidad 15% defectuoso tiene la probabilidad corregida igual a 
0.44. 

EJERCICIO 4. 

Un lote que contiene 12 artfculos de los cuales x son defectuosos y el resto no 
defectuosos es sometido a dos controles. En el primer control se extrae de este lote 
un articulo al azar , si esta bueno se le devuelve al lote y si esta defectuoso se lo 
reemplaza per uno bueno, luego se pasa el lote al segundo control. 

a) Determinar el numero artfculos defectuosos que hay en el lote si este pasa al 
segundo control de forma tal que la probabilidad de extraer al azar aquf un 
articulo no defectuoso es 61/72. 

b) Suponga que el lote pasa al segundo control con el numero de defectuosos 
hallados en la parte a). El segundo control consiste en extraer 3 artfculos al azar 
a la vez y rechazar el lote si se encuentran al menos dos artfculos defectuosos, 
calcular la probabilidad de aceptar el lote. 

SOLUCION. 

a) Sean los eventos, 

D { : “sale articulo defectuoso en el control f\ i = 1,2. 

B i : “sale articulo bueno en el control f\ i = 1,2. 

La probabilidad de que el articulo sea no defectuoso en el segundo control es 
igual a P(B 2 )~ 61/72. Ademas, 

P(B 2 ) = P(D l )P(B 2 /D l ) + P(B l )P(B 2/ B l ) 




12-jc 12-* 11*+ 144 

12 12 (I2) 2 



Entonces, 



-11*+ 144 61 

(12) 2 "72 



= — , de donde resulta x — 2. 



72 
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b) El lote es aceptado, si en la terna de aruculos no hay defectuosos o hay un solo 
defectuoso. 

Sean los eventos A,-:" los tres artfculos extraidos contienen i defectuosos" 

/ = 0, 1 . La probabilidad de aceptar el lote es: 

2 c 10 r 2 r 10 oi 

Q Q zz 



EJERCICIO 5. 

Un vendedor tiene una lista de 5 clientes a quienes frecuentemente les ofrece un 
producto. La probabilidad de que uno de tales clientes le compre el producto es 
distinta para cada cliente y esta dada por P, = (/ -l)/4, para i = L 2, 3, 4, 5. 

a) Si selecciona uno de los clientes al azar, ^cual es la probabilidad de que este 
le compre el producto? 

b) Si selecciona uno de los clientes al azar y este le compra el producto una 
primera vez, ^cual es la probabilidad de que en una segunda seleccion al 
azar este mismo cliente le compre el producto?. 

SOLUCION. 

Sean los eventos: 

A,: "El vendedor escoge al /-esimo cliente ", i = 1, 2, 3, 4, 5. 

B: "El cliente le compra el producto" . 

P(A,) = 1/5 y P(B / A z ) = (i - 1) / 4 para: / = 1, 2, 3, 4, 5 
Entonces, 

5 

a) P{B) = £ P(A i )P(B/A,) = (l/5)(0/4 + 1/4 + 2/4 + 3/4 + 4/4) = l/2 

i-l 

b) Si el cliente le compra el producto una primera vez, la probabilidad de que haya 
escogido al i-esimo cliente es P(A Z IB) = (l/5)(t- l)/l/2 = (i — 1 )/10 

Sea C: "El mismo cliente seleccionado una segunda vez le compra el producto" 
Entonces, P(C /( A, IB)) = ( / - 1) / 4 para i = 1, 2, 3, 4, 5 
Luego, 

P(C)= ]T P(A,/ B)P(C /( A, / B)) = (0/10X0/4) + (1/10X1/4) + (2/10)(2/4) 

1 = 1 

+ (3/10X3/4) + (4/10)(4/4) = 3/4 
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EJERCICIOS 

1. Si m) = 5/8, P(B) = 3/4 y P(A/B)= 2/3, calcular p(a/B 1 ). 

Rp. 1/2. 

2. Si P(B) = 3/15, P(B/A) = 1/5 , y P( A n B) = 1/15 , calcular P(Ar^B l ). 

Rp. 4/15 

3 . En una muestra de 120 loretanos se encontro que el 60% sufre alguna 
enfermedad, el 30% tienen al menos 30 anos, y el 20% son menores de 30 anos 
y sanos- Si uno de tales loretanos es escogido al azar, <xual es la probabilidad 

a) de que sufra alguna enfermedad y tenga al menos 30 anos?. 

b) de que sufra alguna enfermedad si tiene al menos 30 anos?. 

Rp a) 12/120, b) D/36- 

4 . De 200 clientes de credito de una tienda comercial, 100 tienen creditos menores 
que $200, 15 tienen creditos de al menos $500, y 1 10 tienen creditos menores de 
4 anos. Ademas 30 clientes tienen creditos de al menos 4 anos y de 200 a menos 
de $500, y 1 0 clientes tienen creditos de al menos $500 y menos de 4 anos. 

a) Si se elige un cliente al azar, /.cual es la probabilidad de que tenga credito 
menos de 4 anos si tiene saldo de credito de menos de $200°. 

b) Si se eligen dos clientes al azar y resultan de al menos de 4 anos de credito, 
t.cual es la probabilidad de que uno tenga saldo de credito de $500 o mas?. 

Rp. a) 45/100, b) C ] Cj / C 2 . 

5. En una encuesta de opinion se encontro que el 25% de los electores votarian por 
el candidato E. De los que no votarian por E el 20% son mujeres y el resto son 
hombres. Ademas la probabilidad de que un elector elegido al azar sea hombre 
es 0.70. Si se elige un elector al azar y resulta ser mujer, ^cual es la probabilidad 
de que no vote por E? 

Rp 0.15/0.30 

6 . Un comerciante recibe para su venta 80 objetos, 2/5 del proveedor A y el resto 
del proveedor B. El 12.5% de objetos de cada proveedor son defectuosos. Si se 
hace una inspeccion de cuatro objetos escogidos al azar a la vez y si resultan 

a) ser de B, ^cual es la probabilidad de que al menos uno sea defectuoso?. 

b) tres defectuosos, ^cual es la probabilidad de que dos de los defectuosos 
provengan de A?. 

Rp. a) 1 -(C 4 42 fcf ) , b) c 2 4 c, 6 c , 70 / cfc , 70 = c 4 cf / C 3 0 

7. En horas de trabajo, una cervecerfa utiliza dos maquinas embotelladoras Ml y 
M2, pero no operan simultaneamente. La probabilidad de que la primera 
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maquina se descomponga es 0.2. Si la primera maquina se descompone se 
enciende la segunda, la cual tiene probabilidad de descomponerse de 0.3. ^Que 
probabilidad hay de que el sistema embotellador no este funcionando en las 
horas de trabajo?. 

Rp. fella maquina i:l,2. P(M,nM 2 )= P(Mi)P(M 2 / M,)=0.2x0.3=0.06 

8. En un lote de 50 artfculos, hay 10 de tipo A y 40 de tipo B, se extraen del lote 5 
articulos al azar uno por uno si reposicion, /cual es la probabilidad de que al 
menos uno de estos sea de tipo A?. 

Rp. P(al menos uno de tipo A)=l-P(ninguno de tipo A)=0.69 

9. Solo una de las 10 llaves que lleva una persona abre la cerradura de su puerta. 

El prueba las llaves una por una escogiendo al azar cada vez una de las llaves no 
probadas. Calcular la probabilidad de que la Have que abre la cerradura sea 
escogida en el quinto intento. Rp. 0 l 

10 . En una urna hay tres balotas numeradas de 1 a 3. Las balotas se sacan al azar 
una a una y sin reemplazo. Si la balota numerada con r se saca en la r-esima 
extraction se considera un exito. Hallar la probabilidad de obtener un exito. 

Rp. 1/2. 



11 . Se prueba un lote de 48 focos uno por uno (sin reposicion). Si el lote contiene 

dos defectuosos, ^cual es la probabilidad de que el ultimo defectuoso se detecte 
en la tercera prueba? Rp. P{DiB 2 D^)+ P(B,D2D 3 )=0.001 8 

12 . La urna 1 contiene dos bolas rojas y dos bolas azules, mientras que la urna 2 

contiene una bola roja y tres azules. Una bola es seleccionada aleatoriamente de 
la urna 1 y colocada en la urna 2. Luego una bola es seleccionada al azar de la 
urna 2 y colocada en la urna 1. Si ahora una bola es seleccionada al azar de la 
urna 1, ^cual es la probabilidad de que esta sea roja?. Rp. 9/20 

13 . Una urna contiene 5 fichas rojas y algunas fichas blancas. Se extrae al azar una 

ficha de la urna y se reemplaza por una del otro tipo. Luego se saca de la urna 
una segunda ficha. Determinar el numero de fichas blancas en la urna si se sabe 
que la probabilidad de que la segunda ficha sea roja es 0.5. Rp. 5 

14 . Para decidir si se acepta o no un lote de 12 objetos en donde existen 3 
defectuosos, se toman dos objetos al azar y a la vez. Si los dos son defectuosos, 
se rechaza el lote; si los dos son buenos se acepta el lote, y si solo uno es bueno 
se toman otros dos objetos al azar y a la vez dc los 10 que quedan. Esta vez, si 
alguno es bueno se acepta el lote, de otro modo se rechaza. Calcular la 
probabilidad de aceptar el lote. 

Rp. 36/66 + (27/66)(44/45). 
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15. Si P(A) = 1/3 y P(A u B) = 1 1/21, calcular P(B) 

a) si los eventos Ay B son excluyentes. 

b) si los eventos Ay B son independientes. Rp. a) 4/21 . b) in. 

16. Sea el espacio muestral: Cl = { w } , w 2 , vv 3 , w 4 } , donde, 

P (\ w \ }) = 1/4 . P({h- 2 }) = 1/4, P({vv 3 }) = 1/4, P( ( w 4 } ) = 1/4 

Sean los eventos: ,4 = {w, , w 2 }, fi = {w,,w^} 7 C = {w 1 ,m’ 4 }. <-.Son los eventos 
A, B y y C independientes?. 

Rp. no, pues no se veriflca, P(ABC)=P{A)P(B)P{C). 



17. Pruebe que: 

a) Si el evento B es independiente del evento Ay entonces, A es independiente 
de B. 

b) Ay B son eventos independientes, si y solo si. 

P(AnB)= P(A)P(B) 

c) Si A y B son eventos independientes, entonces, P(B/ A) = P( B j A c ) 

18. Un negocio es tal que su probabilidad de exito es p . El negocio se realiza dos 
veces de manera independiente. ^Que valor de p hace maxima la probabilidad 

a) de obtener exito una sola vez? 

b) de obtener exito al menos una vez? 

Rp. a) Prob=2/?(l-p), Prob. es maxima si p= 1/2, b) 2p( I —ph-p 2 . es m&ximo. si p - 1 

19. Pruebe que todo evento de probabilidad cero o uno es independiente de 
cualquier otro evento. 

Rp. Si P(A)= 0. de AnflcA P(AnB)=Q=P(A)P(B). Si PiA\=\. de P(B)=P{AnB)+P{A c B). 

P(Ar\B)=P(B)=P(A)P(B), ya que P(A C B)<P(A C )= 0 

20. Suponga que una companfa utiliza un procedimiento de prucba que es confiable 
en 98%. -Es decir identifica correctamente a un objeto como defectuosos o no 
defectuoso con una probabilidad de 0.98-. En un esfuerzo por reducir la 
probabilidad de error a cada objeto se somete a dos pruebas independientes 

a) <*Cual es la probabilidad de que un objeto no defectuosos no pase ambas 
pruebas? 

b) ^Cual es la probabilidad de que se detecte a un objeto defectuoso, es decir de 
que no pase por lo menos una de las dos pruebas 7 

Rp a) 0.02x0.02, b) 0.98x0.02+0.02x0.98+0.98x0.98 
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21. Una urna contiene 10 objetos numerados de 1 a 10. Un juego consiste en sacar 
tales objetos y termina cuando sale el numerado con uno. ^Cuai es la 
probabilidad de que el juego termine si se sacan al azar 5 objetos 

a) a la vez ?. 

b) uno a uno sin reposition?. 

c) uno a uno con reposicion?. Rp. a) 0.5. b) o.i, c) 9 4 /l0 5 . 

22. Se ha determinado que el porcentaje de televidentes que ven los programas A, 
B y C son respectivamente 0.4, 0.5, y 0.3. Cada televidente ve los programas 
independientemente uno del otro. Si se elige al azar a uno de tales televidentes, 
^que probabilidad hay de que vea 

a) dos de los tres programas?. 

b) al menos uno de los tres programas?. Rp a) 0.29. b) 0 79 

23. En una oficina hay dos computadoras A y B que trabajan de manera 

independiente. Si en un momento cualquiera la probabilidad de que la maquina 
B este en mal estado es 1/4 y la probabilidad de que solo la maquina A este en 
mal estado es 3/10, £cual es la probabilidad de que solo la maquina B este en 
malas condiciones?. Rp. 3/20 



24. En los circuitos de la figuras que siguen, la probabilidad de que cada Have se 
cierre (pase corriente) es p, 0< p < 1 . Si todas las Haves se cierran o abren en 
forma independiente, calcular la probabilidad de que la corriente pase de E a S 
en a) , y b). 



a) E 




— S 



b) E — \ 




Rp. a) p(\ + p- p 2 ) t b) 2/? 3 - p 5 . 



25. Un expenmento se realiza tantas veces en forma independiente hasta obtener el 
primer exito. Suponga que en cada intento la probabilidad de que se tenga exito, 
es de 0.95 si se siguen correctamente las instrucciones; y es de 0.20 si no se 
siguen correctamente las instrucciones. Calcular la probabilidad de alcanzar el 
exito en tres intentos a lo mas 

a) si se siguen correctamente las instrucciones cada vez, 

b) si no se siguen correctamente las instrucciones cada vez. 

Rp. a) 0.999875, b) 0.488 
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26. Calcular la probabiiidad de que un mensaje de n (rt > 1 ) dfgitos binarios, (0, 

y 1 ) sea incorrect, si la probabiiidad de recibir un digit incorrecto es p y si los 
digits se reciben cn forma independientc. Rp. 1—0 -p) n . 

27. Suponga que un sistema funciona si al menos una de sus componentes funciona. 

Si las componentes trabajan independientemente y si la probabiiidad que falle 
cada una es de 0.01, ^cuantas componentes deberfa tcner el sistema para que no 
falle con probabiiidad de 0.9999?. Rp. 2. 

28. Una persona esta expuesta a 1 riesgo en 100 ocasiones independientes. Si la 
probabiiidad de que ocurra un accidente es 1/100 cada vez, hallar la 
probabiiidad de que un accidente ocurra en una o mas ocasiones. 

Rp I - (99/1 00) 100 = 1 - 0.366 = 0.634. 

29. Un experiment aleatorio se repite sucesivamente 10 veces en forma 
independiente. En cada prueba la probabiiidad de exit es 1/4. Calcular la 
probabiiidad de que ocurran 3 exits si el ultimo intento debe ser un exito. 

Rp. Cj (0.25) 3 (0.75) 7 . 

30. 'Respect al partido de futbol que protagonizaran los equipos A y B el proximo 
domingo, se piensa lo siguicnte: De todas maneras se abrira el marcador y 
cualquiera de los dos equipos tiene igual probabiiidad de hacerlo. Si A anota el 
primer gol, la probabiiidad de que el proximo tambien sea de A es 2/3 contra 
1/3 de que sea de B; en cambio si B es el que anota, primero el gol, habra un 
segundo gol que puedc ser con igual probabiiidad para cualquier bando. Si el 
marcador llega a ponerse dos a cero a favor de cualquier equipo la 
desmoralizacion de uno y la apatfa del otro impediran que haya mas goles; en 
cambio si llega a ponerse 1-1, puede ocurrir tres cosas con iguales 
probabilidades: que A anote y gane 2-1, que B anote y gane 2-1 o que no haya 
mas goles. Use un diagrama de arbol para calcular: 

a) la probabiiidad de que B gane. 

b) la probabiiidad de que B haya abierto el marcador dado que gano el partido. 

1 I 1 I I 1 1 1 14 1 1 14 

Rp a) P(B gane} = — x — x — + — x — i — x — x — = — , b) ( — I )/ — 

2 3 3 2 2 2 2 3 36 4 12 36 

31. Suponga que en cierta region del pafs la probabiiidad de que un adulto mayor de 

40 anos tenga c&ncer es 0.05. La probabiiidad de que el diagnostico sea correct 
es 0.80, y de que sea errado es 0.20. Si se elige al azar a una de esas personas, 
calcular la probabiiidad de que 

a) se le diagnostique cancer. 

b) si se le diagnostica cancer, tenga realmente tal enfermedad. 

Rp. a) 0.23 b) 0.04/0.23 = 0. 1 739. 
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32. Ante una pregunta de opcion multiple de 5 alternativas donde solo una es la 
respuesta correcta, un examinado, puede saher la respuesta o no saberla o tener 
dudas. Si no sabe, marca al azar. Si duda, reduce las alternativas a 3 de las 
cuales una es la correcta y luego, responde al azar Si la probabilidad de que 
conozca la respuesta es 0.5, de que no conozca es 0.2 y de que dude es 0.3 

a) Hallar la probabilidad de que acierte la pregunta. 

b) Si acerto la pregunta, ^que probabilidad hay de que no haya sabido la 

repuesta? Rp. a) 0.64 b) 0.04/0.64. 

33. Solo el 60% de la mercaderfa que recibe un comerciante del fabricante A es de 

calidad excepcional, mientras que el 90% de la mercaderfa que recibe del 
fabricante B es de calidad excepcional. Sin embargo la capacidad de fabricacion 
del fabricante B es limitada, y por esta razon solo el 30% de la mercaderfa le es 
permitido adquirir del fabricante B, el 70% la adquiere de A. Se inspecciona un 
embarque que acaba de Ilegar y sc encuentra que es de calidad excepcional, 
^cual es la probabilidad de que provenga del fabricante A?. Rp 0.42/0.69. 

34. En un proceso de produccion el porcentaje de objetos no defectuosos fabricados 

es 70% con probabilidad 0.35, 90% con probabilidad 0.25, y 60% con 
probabilidad 0.4. Si se selecciona al azar uno de tales objetos y si resulta no 
defectuoso, calcular la probabilidad de que sea de calidad del 90% no 
defectuoso. Rp. 0.225/0.7 1 

35. El 100% de una poblacion de electores se divide en tres estratos sociales 
excluycntes: baja, media y alta; de manera que la clase baja o media son el 90% 
del total, y la clase media o alta el 40% del total De los primeros sondeos 
realizados para las prdximas elecciones, se afirma que el porcentaje de electores 
que volarfan por el candidato D puede ser: 

30% de clase baja 50% de clase media 70% de clase alta 

a) Si se elige un elector al azar y se encuentra que vota por D, ^cual es la 
probabilidad de que pertenezca a la clase alta?. 

b) Si se escogen dos electores al azar, ^que probabilidad hay de que uno de 

ellos vote por D?. Rp a) 0 175, b) 0 48 

36. Una maquina produce un tipo de objeto en distintos periodos. Si la maquina esta 
bien ajustada en un periodo, el 80% de los objetos producidos pasan el control 
de calidad, de otro modo s61o pasan el 60%. Se ha determinado que el 90% de 
los periodos la maquina est£ bien ajustada De los 25 objetos producidos en un 
solo periodo se escogen 3 at azar y a la vez para el control de calidad. 

a) iQut probabilidad hay que s61o 2 pasen el control de calidad?. 

b) Si solo 2 pasen el control de calidad ^que probabilidad se tiene que haya 
sido producido cuando la maquina trabaja en un periodo de buen ajuste?. 

Rp. a) 960/2300, b) 855/960. 
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37. El departamento de creditos de una lienda comcrcial afirma que segun sus 
experiencias pasadas la probabilidad de que el 20 % de los clientes que compran 
por mas de $50 es igual a 0.3 y que la probabilidad de que el 60% de los 
clientes compren por mas de $50 es igual a 0.7. Sin embargo al entrevistar a dos 
clientes al azar se encuenlra que los dos compraron por mas de $50. En base a 
este resultado, <.que modification acerca de las probabilidades 0.3 y 0.7 debera 
hacer la tienda comercial?. 

Rp.D:2 compran por mas de $50. P( 20%)=0.3, P(60%)=0.1. P( D)=0.3(0.2) 2 +0.7(0.6) 2 = 
0.012+0.252=0.264. />(20%/D)=0.045, P(60%/D)=0.955 

38 . A un candidato le han indicado que obtendria el 60% de los votos con 
probabilidad 0.2, el 45% de los votos con probabilidad de 0.3 y el 70% de los 
votos con probabilidad 0.5. Despues de preguntarle a 4 personas se obtiene que 
2 de ellas votarfan por el candidato. A la luz de este resultado, ^cual es la 
probabilidad de que el candidato obtenga el 60% de los votos?. 

Rp. 0.2 c\ 0.6 2 0 4 2 + 0.3 Cj o 45 2 0.55 2 +0.5 C\ 0.7 2 0.3 2 =0.1095, 0.06912/0.10955=0.63. 

39 . Una agencia de publicidad observa que el 2% de los compradores potenciales de 
un producto ve su propaganda por periodico, el 20% ve dicha propaganda por 
television y el 1 % ve los dos tipos de propaganda. Ademas de cada tres que ven 
la propaganda uno compra dicho producto y el 7.9% compran y no ven la 
propaganda 

a) /Cual es la probabilidad de que el comprador potencial compre dicho 
producto si no vio la propaganda?. 

b) Si un comprador potencial compra el producto, ^cual es la probabilidad de 
que no haya visto la propaganda? 

Rp a) 0.079/0.79=0 . 1 , b) 0.21 (l/3)+0.79( 1/1 0)=C. 149, y 0.079/0.149 

40 . Un gerente esta a la espera de la llamada tclefonica de 3 de sus clientes para 
realizar un negocio. La probabilidad de que lo llamen cualquiera de sus 3 
clientes en forma independiente es 0.3. Ademas la probabilidad de realizar el 
negocio es de 0.20 si llama un cliente, es de 0.4 si llaman dos clientes, y es de 
0.8 si llaman los 3 clientes. Si ninguno de los 3 le llama, no reahza el negocio. 

a) calcular la probabilidad de que realice el negocio. 

b) ^cuantas llamadas de clientes es mas probable que haya recibido el gerente 
sabiendo que realizd el negocio 7 . 

Rp. Si A ■: "llaman i clientes ", i = 0,1. 2,3, entonces, P( A t ) = C*(0.3)' (0.7)* '* 

Si B: "realiza negocio". = 0, P(B/A, ) = 0.2 . P(B/A 2 ) = 0.4, P(B/A ,) = 0.8 

a)0+0.0882+0.0756+0.02 16=0. 1854, b) 1 pues es 0.0882/. 1854 
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VARIABLES ALEATORIAS Y 
DISTRIBUCIONES DE PROBABILIDAD 



6.1 Variable aleatoria 

Una variable estadistica es una caracteristica (cualilativa o cuaniitativa) que se 
mide u observa en una poblacion. Si la poblacion es aleatoria y la caracteristica es 
cuantitativa la variable estadistica es denominada variable aleatoria. Las variables 
aleatorias se clasifican en discretas y continuas. 

Definicion. Se denomina variable aleatoria, a una variable estadfstica 
cuantitativa definida en un espacio muestral Q . 

Esto es, una variable aleatoria X es una funci6n definida en Q tal que a cada 
elemento w e fl le asocia el numero real x = X ( w) , (figura 6. 1 ). 



Q 




El dominio de la variable aleatoria X es el espacio muestral Q y el rango es un 
subconjunto de los numeros reales que denotaremos por siendo, 

R x =Jjc€91/jc = X(w),u gQ} . 
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EJEMPLO 6.1. 

Sea Q el espacio muestral que se obtiene al lanzar al aire una moneda tres 
veces consecutivas, esto es, 

Q = (SSS, SSC, SCS, CSS, SCC, CSC, CCS, CCC}. 

Si X se define en Q como "el numero de caras obtenidas", entonces, X es una 
variable aleatoria cuyo rango es el conjunto: R x = {0, 1,2,3). En efecto, 

X = 0, corresponde al evento elemental {SSS}. 

X = 1, corresponde a los eventos elementales {SSC}, {SCS} y {CSS]. 

X - 2, corresponde a los eventos elementales {SCC}, {CSC} y {CCS}. 

X = 3, corresponde al evento elemental {CCC} 

EJEMPLO 6.2. 

Sea Q , el espacio muestral que resulta de lanzar un dado sucesivamente veces 
hasta obtener el primer dos, esto es, . 

Cl= {E, FE, FFE, FFFE,...etc...} 

donde E(exito)=“saIe dos”, y F(fracaso)="No sale dos” , en cada prueba. La 
funcion Y definida en Q, como "el numero de lanzamientos realizados", es una 
variable aleatoria, cuyo rango es el conjunto: R Y = { I,2„etc..}. Esta variable 
ejecuta las siguientes asignaciones: 

K(E) = 1 , Y( FE) = 2, F(FFE) = 3,... etc.. 

En algunos casos el resultado w de un experimento aleatono es ya la 
caracteristica numerica que queremos anotar, en este caso se define la variable 
aleatoria X como la funcion identidad , esto es, X(w) = w. 

EJEMPLO 6.3. 

Sea Q el espacio muestral que consiste del tiempo de duracion de un artefacto 
electrodomestico obtenido al azar de un lote, entonces, 

Q = {we S IR / w> 0} . Si la variable aleatoria X se define tambien como el tiempo 

de duracion del artefacto, entonces X es la funcion identidad cuyo rango es el 
conjunto: 



R x = {*€SR/jc>0}. 

NOTA. La variable aleatoria es pues, una funcion que atribuye a cada evento 
elemental un numero que no es aleatorio o imp revisit le si no fijo a 
predeterminado. 
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Lo que es aleatorio es el experimento sobre cuyo espacio muestral se define la 
variable aleatoria. 

Esta funcion puede estar definida por una ley o regia o por un conjunto de 
numeros reales atribuidos mediante dicha ley o regia. 

En la mayoria de las aplicaciones, se esta mas intcresado en los valores que 
toma la variable, ignorando completamente el espacio muestral en el que se define. 

El rango de la variable aleatoria es un espacio muestral inducido por la variable. 

Clasificacion. 

Las variables aleatonas se clasifican en general en discretas y continuas 

Una variable aleatoria discreta es aquella cuyo rango es un conjunto finito o 
infinito numerable de valores (ejemplos 6.1 y 6.2). 

Si la variable aleatoria X es discreta, su rango se expresara en general por: 

R x ={*,, x 2 .... 1 . 

Una variable aleatoria continua es aquella cuyo rango es un intervalo en o 
conjunto infinito no numerable de valores reales (ejemplo 6.3). 

En general las variables aleatorias discretas representan datos que provienen del 
conteo del numero de elementos, mientras que, las variables aleatorias continuas 
representan mediciones , por ejemplo, tiempo, peso, longitud, etc.. 



6.2. Variable aleatoria discreta: Funcion de 
probabilidad y funcion de distribucion 
acumulada. 

6.2.1. Probabilidad en el rango Rx- 

Una variable aleatoria discreta asume cada uno de sus valores con cierta 
probabilidad que denotaremos por P x (probabilidad inducida por X). 

En efecto, si el rango de la variable aleatoria X es el conjunto finito de numeros, 
R x ={1,2,...,^} y si B = { jc f } es un evento en R x , entonces. 
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P x ({x,}) = P({we Q/X(w) = jc,}), 

o P x ({jc- }) = P(A) , donde, A = ( wg Q/ X(w) g Bj . 

Con frecuencia, se utiliza la expresion P[X - x t ] para denotar la probabilidad 
P x ( { jc f } ) . esto es, 

P[X =jc f ] = P({wGQ/X(w) = jc t }). 

Por ejemplo, si la variable aleatoria X es el numero de caras que resultan al 
tirar una moneda 3 veces, el rango de X es R x = {0,1,2,31, entonces, 

P[X = 0] = P({SSS})= 1/8. 

P[X= 1] = P({SSC o SCS o CSS}) = 3/8. 

P[X = 2] = P( { SCC o CSC o CCS } ) = 3/8. 

P[X = 3] = P({CCC}) = 1/8. 

En general, sea P una probabilidad definida en un espacio muestral Cl , y X una 
variable aleatoria definida en Q cuyo rango es el conjunto de numeros R x , la 
probabilidad P x del evento B en R x se define por: 

P X {B) = P(A) 

siendo A en Q un evento equivalente a B (figura 6.2), esto es. 



A = {wgQ/X(w)gB}. 
Q 




Fig. 6.2 



www.FreeLibros.me 



206 



Estadistica 



NOTAS. 

1- El conjunto de pares (jc i9 P[X = jc # - ]) es la distribution de probabilidades de la 
variable aleatoria X . 

Esta distribution es similar a una distribution de frecuencias relativas. 
por tanto, se pueden calcular, por ejemplo, medidas de tendencia central y de 
dispersion mediante un proceso similar al que se hizo con la distribution de 
frecuencias relativas. 

Solo habra que cambiar las notaciones por tratarse ahora de una poblacion. 

2. Las probabilidades p, = P[X =jc / ] > jc, e R x satisfacen las propiedades: 

a) p % > 0, para cada jc, e R x , b) ^ p t = 1 . 

*,€/?* 

3. Por extension para todo numero real x ^ x, , siendo g R x , se define. 



P[X =jc] = P(0) = O 



En consecuencia, queda definida la probabilidad P[X = jc] para todo numero 
real x. 



6.2.2 Funcion de probabilidad 

Definition. Sea X una variable aleatoria discreta. Se denomina funcion (ley o 
modelo o distribution) de probabilidad de X a la funcion /(jc) definida por 

f(x) = P[X = jc] para todo jc numero real y que satisface las siguientes 
condiciones: 

•) /(-*)- 0 V-teSR, y ii) ^ /(*,) = 1 

Xi eR x 

La condition ii) 

n 

Es: X/(J,> = «*si R x = {jc 1 ,jc 2 ,...,^ /i } es finito. 

»=i 

OP 

Es: y/(jc t -) = 1, si R x ={x l9 x 2 *..- 9 etc.) es infinito, 

i-1 
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NOTAS. 

1. Si A <z R x , entonces, la probabilidad de A es el numero: 

P(A)= £/>[X =*]=£/(*,). 

x,eA x,eA 

El lector deberia verificar que P(A) es una probabilidad, esto es, satisface 
los axiomas de probabilidad. 

2. La funcion de probabilidad de una variable aleatoria X se puede expresar: por 

una ecuacion : /( jc) = P[X = jc] = expresion de jc , o por el conjunto de pares 
{ (jc f , /?,)/ p t = /(jc, ), jc, e R x ] o por una tabla. como 6.1 (si Rx es finito) 



Tabla 6-1 : Distribucion de 


probabilidad de v. a. discreta 


Valores jc, de X 




*2 


*3 




x n 


Probabilidad p { = P[X = jc, ] 


p i 


Pi 


Py 




Pn 



La grafica de una distribucion de probabilidades discreta es la grafica de 
bastones que consiste de segmentos verticales continuos o punteados de 
longitud proporcional a la probabilidad respectiva en cada valor x, de la 
variable (figura. 6.3). 

EJEMPLO 6.4. 

Sea X la variable aleatoria definida como el numero de caras que ocurren al 
lanzar una moneda 4 veces. 

a) Determinar la distribucion de probabilidades de X . Graficarla. 

b) Calcular la probabilidad P[0 < X < 2] . 

c) Determine la distribucion de probabilidades de X si la moneda se lanza n veces 
(n> 2). 

SOLECION. 

a) El rango de la variable aleatoria X, es el conjunto R x = {0.1, 2,3,4 } . 
Suponiendo que los dieciseis sucesos elementales del espacio muestral son 
equiprobables, la funcion de probabilidad, es descrita por: 

/( 0) = P[X = 0] = P(SSSS) = 1/16 

/(I) = p[X = 1] = P(SSSC 6 SSCS 6 SCSS 6 CSSS ) = 4/16 

f(2) = P[ X = 2] = P(SSCC 6 SCSCo SCCS 6 CSSC 6 CSCS 6 CCSS) = 6/1 6 

/( 3) = P[X = 3] = P(SCCC 6 CCSC 6 CSCC 6 CCCS) = 4/16 
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/( 4) = P[X - 4] = P(CCCC) — 1/16 

Observar que si k e R x , entonces, X - k , si y solo si, en las 4 tiradas de la 

moneda aparecen k caras y 4-t sellos. Esto ocurre de C\ formas. Cada una de 
esas formas tiene probabilidad: 

(1/2)* (1/2) 4 * =(l/2) 4 =1/16 

siendo /c = 0, 1, 2, 3, 4. Luego, la funcion de probabilidad del numero de caras se 
puede describir como tabla 6.2 6 como la ecuacion: 

C 4 

/(*)=—, k= 0,1, 2, 3, 4. 



Cuya grafica es la figura 6.3. 



b) P[0<X<2] = y/(A:) = /(l) + /(2) = -i + -^ = 

7T 16 16 



10 

16 



O f ix) = * 



x i 


fix,) 


0 


1/16 


1 


4/16 


2 


6/16 


3 


4/16 


4 


1/16 



Tabla 6.2 



jc = 0,1,2,...,* 




NOTA. Si p i = f(Xj ) , la media de X se calcula por p = ^ p t x i , y la vananza 
por g 2 = ^ j p i xf -p 2 . En el ejemplo 6.4, el numero de caras al lanzar una 

moneda 4 veces, tiene media p. —2 caras, v varianza <j~ = 1 cara\ (ivenficar!). 
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6.2.3 Funcion de distribution acumulada de variable 
aleatoria discreta 

Definition. La funcion de distribution acumulada (f.d.a.) de probabilidades o 
simplemente funcion de distribution, FXjc) , de la variable aleatoria discreta X, 
cuya funcion de probabilidad es /( jc) , se define por: 

F(x)-P[X < jc] - ^ P\ X = k] = ^ f(k ), para-oo < jc <oc - 

k< x k< x 



EJEMPLO 6.5. 

Sea X la variable aleatoria definida como el numero de caras que resultan al 
lanzar una moneda 4 veces. 

a) Hallar la funcion de distribution F(x) de la variable aleatoria X y graficai la. 

b) Usando F(jc), calcular P[0 < X < 2] . 



SOLUCION. 

a) La funcion de probabilidades fix) de la variable aleatoria X esta descrita en el 
tjemplo 6.4. por: 

/(O') = 1/16. /( 1) = 4/16. /( 2) = 6/1 6, /( 3) = 4/16 y /( 4) = 1/16. 

Entonces, F(0) = /(0) = 1/1 6 . 

F(I) = /(0) + /(l) = 1/16 + 4/16 = 5/16 

F(2) = f(0) + /(l) + /( 2) = 1/16 + 4/1 6 + 6/16=11/16 



F( 3) = /( 0) + /(l) + /(2) + /(3) = 1/1 6 + 4/1 6 + 6/1 6 + 4/1 6 = 1 5/1 6 



F(4) = /( 0) + /(]) + /( 2) + / (3) + / (4) = 1/16+4/16+6/1 6+4/16+1/16=1 



Por tanto. 



F(x) = 



0, x< 0 
1/16, 0 < jc < 1 
5/16, 1 < jc < 2 
11/16, 2 < .v < 3 
15/16. 3 < ,c < 4 



1, -v > 4 



La grafica de esta funcion de distribucion esta dada en la figura 6.4. 
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F(x) 



16/16 

15/16 

11/16 

5/16 

1/16 




? c 

i 

i 

i 

4 



1 2 



3 



4 



X 



Fig. 6.4. Distribution de frecuencias acumuladas del numero de caras 

Observar que F(x) da "saltos" en los valores de jc= 0,1,2,3,4. Por ejemplo, 
F( 2.99) = F( 2) = 11/16, F(3) = F(3.99) = 15/16. etc.. 



b) P[0< X <2] = P[X <2]-P[X <0]= F(2)~ F(0) = — — - = — • 

16 16 16 



NOTA. En general si X tiene rango finito R x = { jc, , x 2 ,...>x n } , y funcion de 
probabilidad f(x i ) , la funcion de distribution acumulada de X es: 



F(x) = 



' 0, 

41 )* 

L 



- 00 < x < JC] 

jc- < jc < , i = 1,2,. ..n — 1 

x n < X < +00 



EJEMPLO 6.6. 

Un lote de 10 artfculos contiene 4 defectuosos. Si se obtiene una muestra al azar 
de cinco artfculos, determine la distribution de probabilidades del numero de 
artfculos defectuosos en la muestra, si se escogen 

a) Los cinco a la vez 

b) Uno por uno con reposition 

SOLUCION. 

Sea X el numero de artfculos defectuosos en la muestra de cinco. 

a) Si se escogen los 5 a la vez, el rango de X es el conjunto R x = {0,1, 2,3,4} . Si 

k E R x , el evento X = k significa que de los 5 escogidos a la vez, k son 
defectuosos y 5 — k son no defectuosos y esto ocurre de C%C$_ k . Por otro 
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lado, se escogen 5 articulos a la vez de 10, de C\| ° formas. Entonces, la funcion 
de probabilidad fix) de X es 

f{x) = P[X=k]= CkC l 5 ~ i . k = 0,1, 2,3,4. 

C 5 

El lector deberfa verificar que la suma de probabilidades es igual a 1 . 

Tambien deberia verificar que la misma distribucion se obtiene si los cinco 
articulos se escogen uno por uno sin reposicion. 

b) Si se escogen los 5 uno por uno con reposicion, el rango de X es el conjunto 
R x = {0,1,23,4,5} . Si keR x , X=k signifies que de los 5 articulos, k 
defectuosos ocurren independientemente con probabilidad p- 4/10 cada uno, 
y 5 - k no defectuosos ocurren independientemente con probabilidad 47 = 6/10 

cada uno. Estos eventos ocurren de C* formas. Entonces. la funcion de 
probabilidad fix) de X es 

f(x) = P[X =A:] = C*W'*- k =0.1.23.4.5. 

donde p- 4/10 y g = 6/10, 

El lector debe verificar que la suma de probabilidades es igual a 1 . 



EJEMPLO 6.7. 

Una urna contiene 3 fichas de color rojo y una de color azul. Un experimento 
aleatorio consiste en extraer fichas al azar de la urna uno a uno sucesivamente. 

a) Determinar la distribucion de probabilidades del numero de intentos que se 
realizan hasta que aparezea la primera ficha azul. 

al ) sin reposicion, a2) con reposicion. 

b) Si dos personas A y B juegan sacando alternativamente una ficha con reposicion 
de la urna y si gana el que obtiene la primera ficha azul. ^.cual es la probabilidad 
de que A gane el juego si el juega primero?. 

SOLUCION. 



a) Sea X la variable aleatoria que denota el numero de intentos hasta que ocurra la 
primera ficha azul. 

al) Si la extraccion es sin reposicion, el rango de X es el conjunto 
R x = {1,23,4} . Entonces, 

/( l)=P[A'=l]=i 
4 



www.FreeLibros.me 



212 



Esiadistica 



/(2) = P[X=2] = ^-xi=i 
4 3 4 

3 2 11 

/(3) = />[X=3]=-x-x-=- 

4 3 2 4 

3 2 11 

f(4) = P[X =4]= — x — x — x — = 

4 3 2 1 



4 



Esta distribucion de probabilidades iguales es conocida como 

distribucion uniforme. 



a2) Si la extraccion es con reposition, el rango de X es el conjunto 
R x = {1,2,3,..., etc ) . Si keR x entonces, X =k solo si ocurre la ficha 

azul en la k-es ima extraccion con probabilidad 1/4 y no azul en las 
anteriores extracciones independientes con probabilidad 3 / 4 . Luego. la 
probabilidad d e X = k esta dada por: 

/(*) = P[X =k] = , k = 1.2,3,.... etc. 



Se verifica que: 

CO 

X /<*>=! 

*= 1 

En efeclo, utilizando la suma: 




1 + r + r 2 + r 3 + ... = 



1 

1 — r ’ 



silr] < 1 



Z/<*> 

k= 1 






— =i. 
1 -(3/4) 



b) Si A sale primero, entonces juega las veces impares. Luego, 

P[ A gane el juego] = />[X=loX-36X = 56X = 7, etc..] 



+ (^i 
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P[A gane el juego] 



(L) 


l 


UJ 


l-(9/l 6) 



4 

7' 



EJEMPLO 6.8. 

En el ejemplo 6.7 determinar la distribucion de probabilidades del numero de 
intentos hasta que ocurra la segunda roja 

a) Una por una sin reposition. 

b) Una por una con reposicion. 

SOLUCION. 

Sea X la variable aleatoria que denota el numero de intentos hasta que ocurra la 
segunda ficha roja. 

a) Si se escogen uno por uno sin reposicion, el rango de X es el conjunto 

R x ={23}- Entonces. 

/( 2) = P[X = 2] =P(RR) = | x | = I 

/(3) = P[X = 3] = P{RAR o ARR) = -x-x-+-x-x- = - 

4 3 2 4 3 2 2 

b) Si se escogen uno por uno con reposicion el rango de X es el conjunto 
R x ={23,4,...,efc} . Si k e R x , entonces, X = k solo si sale la segunda ficha 
roja en la k-e sima extraccion con probabilidad 3/4 . En las k -1 extracciones 
restantes ocurre la otra roja con probabilidad 3 / 4 y ocurren k - 2 azules 
independientemente con probabilidad 1 / 4 . Luego, la probabilidad d e X = k 
esta dada por: 

/(*> = t\x = k]= (c,*-y~ : W = cf-y-y k = 2,3 



donde p = 3/4, q = 1/4. 

EJEMPLO 6.9. 

En el ejemplo 6.7 si X es la variable aleatoria definida como el numero de 
intentos que se realizan con reposicion hasta que ocurra la primera ficha azul 

a) Hallar la funcion de distribucion acumulada F(x) de X . 

b) Utilizando F(x) calcular P[ 2 < X < 20] . 

SOLUCION. 

a) La funcion de distribuci6n acumulada F(jc) de X esta dada por la expresion: 
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F(x) = 



0, 



si -oo < x < 1 



UB) • - — 

Observarque: £(^0) 



i-i 



, k = 1,2,3,... 



b) P[2<X < 20] =F(20)-F(2) = ^j =0.559 

EJEMPLO 6.10 

Determinar el valor de la constante c para que la funcion f{x) definida por: 

c3 x 

/(jc) = P[X = jc] = , jc = 0,1,2 

jc! 

sea funcion de probabilidad de la variable aleatoria X , cuyos valores posibles son: 0, 
1, 2,...,etc.. Hallar, ademas, la funcion de distribucion acumulada de X y calcular 
P[X > 3] . 

SOLUCION. 

Cada probabilidad fi x) debe ser mayor o igual que cero. Ademas, la suma de 
todas las probabilidades debe scr igual a uno. 

o0 

Para encontrar la constante c utilizaremos la suma: > — — = e z . 

Z-j b i 

*=o K 



Luego, 



Entonces, 



Z— =c IZ- 

ds r f t—d r i 

\*= 

f(x) = 



x=0 



n JC! 
\ x=0 



- ce 3 = 1 , de donde resulta c = e 3 . 



e~*3 x 



, x = 0, 1 , 2 ,... etc... 



La funcion de distribucion acumulada F(x) de esta variable aleatoria es: 
0, si - oc < x < 0 

, t = 0,1,2,3,... 



F(x) = 



^3 k e~ 3 



k=0 



k\ 



si t < x < t + I, 
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Por otra pane, P[X > 3] = 1 - P[0 < X < 2] = l-[/(0) + /(!) + /(2)] 

= l-(e" 3 + 3e" 3 + 4.5c" 3 )= 1-0.423 19 = 0.57681- 

EJEMPLO 6.11 

Un inversionista puede participar en un negocio 4 veces y de manera 
independiente. Cada vez que participa gana o pierde $5000 con la misma 
probabilidad. La persona comienza con $10000 y dejara de participar en el negocio 
si pierde todo su dinero o gana $15000 (o sea si termina con $25000). Hallar la 
funcion de probabilidad de la utilidad del inversionista 

SOLUCION 

Sean: U la variable que representa la utilidad. 

P = pierde con probabilidad = 1/2 
G = pierde con probabilidad = 1/2 
Entonces, los valores de U (montos finales menos capital) son: 

-10,000, en los casos: PP o PGPP o GPPP con probabilidad=6/16 
0, en los casos: PGPG o PGGP o GPPG o GPGP o GGPP 



10.000, en los casos: GGPG o GPGG o PGGG con probabilidad=3/16 

15.000. en los casos: GGG con probabihdad=2/16 



6.3. Variable aleatoria continua: Funcion de 

densidad y funcion de distribucion acumulada. 

6.3.1 Funcion de densidad de probabilidad 

Definition. Se dice que la funcion f(x) es funcion de densidad (ley o 
distribucion) de probabilidad de la variable aleatoria continua X si satisface las 
siguientes condiciones: 

i) f(x)> 0 para todo (9? es el conjunto de los numeros reales). 



con probabilidad =5/16 




f(x)dx = 1 



iii) P(A) = P[xs A]= f(x)dx y para cualquier intervalo 4c91 



A 



www.FreeLibros.me 



2 1 6 Estadistica 



NOTAS. 

1. La condicion i) expresa que la grafica de/(x) no tiene puntos por debajo del eje 
de las abscisas. 

La condicion ii), indica que el area total bajo la curva es igual a uno. 

La condicion iii) expresa: probabilidad igual a area. Esto es, si A = [a,b] y la 
probabilidad P[a < X <b] es igual a la area de la region limitada por la 
curva, el eje X y las rectas X = a, X = b , es decir: (ver figura 6.5) 

P[a<X<b) = \ h f(x)dx 

Ja 




Fig. 6.5 

2. No es dificil verificar que si el evento A es cualquier intervalo en la recta real , 
entonces, P(A) satisface los axiomas de la probabilidad. 

3. Cualquier funcion f(x) que satisfaga solo las condiciones i) y ii) no es 

probabilidad, solo es probabilidad cuando la funcion de densidad es integrada 
entre dos Umites. Por ejemplo, la funcion: 

/(jc) = 3jc 2 /8 para 0 <jc<2, 

satisface las condiciones i) y ii), pero/(jt) no es probabilidad, ya que entre otros 
valores se tiene, f(2) =1.5, /( 1.8) =1.215. 

4. Si x 0 es cualquier valor especifico de la variable aleatoria conti nua X, 
entonces: 

P[X = Jto] = Plx o < x < JC 0 ] = [ f(x)dx = 0 

Jx {) 

Como consecuencias se tiene: 

a) P(A) = 0, no implica A = 0. 

b) P[a<X <b] = P[a < X <b] = P[a<X <b}~~~P\a< X b\ ■ 
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EJEMPLO 6.12. 

Sea / ( jc) una funcion definida en todos los numeros reales por 



cx ~ , si xe[0,2] 
0, si jc e [0.2] 



a) Hallar el valor de la constante c para que, f{x) sea una funcion de densidad 
para alguna variable aleatoria X. 

b) Calcular P[0<X <1] 

SOLUCION. 

a) El area de la figura 6.6 debe ser igual a 1 . entonces. 




resultando, c = 3/8 . Luego, 




3jc 2 /8, si x e [0,2] 
0, si x g [0,2] 



La grafica de esta funcion de densidad esta dada en la figura 6.6. 



Y 







Fig. 6.6 
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6.3.2 Funcion de distribucion acumulada de variable 
aleatoria continua 

Definition. La funcion de distribucion acumulada (f.d.a), Fix) de una variable 
aleatoria continua X con funcion de densidad/(jc), se define (ver figura 6.7), por: 

F{x) = P[X < jc] = f f(t)dt , para-QO < jc < +oo 




EJEMPLO 6.13. 

Sea /(jc) una funcion de densidad de probabilidad de una variable aleatoria X 
cuya grafica es la figura que sigue: 

3/4 

C 



a) Determinar el valor de la constante c y luego la f.d.p. de X. 

b) Hallar la funcion de distribucion acumulada Fix) de X. 

c) Usando F(jc), calcular P[ 5/4 < X < 5/2 ]. 

SOLUCION. 

a) Si el area que encierra la figura con el eje X es igual a uno, entonces, c - 1/4 . 
La funcion de densidad se define a partir de la ecuacion de la recta 
y-l/4 = (3/4-l/4)/(3-l)(x-l), o y - jc/4 . Luego, 




f(x) = 



— , si 1 < jc < 3 

4 

0, en otro caso 



b) La funcion de distribucion acumulada, se calcula por: 



www.FreeLibros.me 



Distribuciones de probabilidad 



219 



F(jc) = 0, si x < 1 , F(x) = 1 , si x > 3. 

f* * x 2 1 

Si 1 < jc < 3, F(x)= —dt 

Ji 4 8 8 

Entonces, 



F(x) = < 



0 , 

x 2 -1 



8 



si x < 1 
, si \<x<3 



1, si x > 3 

La grafica de esta funcion de distribucion acumulada es la figura 6-8. 




EJEMPLO 6.14. 

La funcion de densidad de una variable aleatoria continua X , es descrita por la 
figura 6.9, es decir, /(jt) = 0 , si jc g [0,3], y, 



/(*) = 



cx , 



si 0 < x < 1 
si 1 < x < 2 



-cx + 3c, si 2 < x < 3 



a) Determinar el valor de la constante c. 

b) Hallar la funcion de distribucion acumulada F(x) de la variable aleatoria X y 
graficarla. 
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SOLUCION. 



a) El area que encierra la figura 6.9 debe ser igual a 1 , entonces, c = 1 / 2 . Tambien, 
si usamos integrates para el area se tiene: 

J f(x)dx = J f(x)dx = c J jc <fx + cj dx + cj (—x + 3)dx - 1 

de donde resulta 1/2 . La funcion de densidad de X es entonces: 

jc/ 2, si 0 < x < 1 

1/2, si 1 < jc<2 

(-x + 3)/2, si 2<x<3 
0, en otros casos 



/(*} = 



F(x) = f 0 dr = 0, para x < 0 

J— oO 

F(jc) = F(0) + [ X -dt = 0 + 

Jo2 




= — , para 0<jc<1, 

4 



C x 1 (1) 

F(x)=F(l)+ | ^dr=-^f- + 

2 4 

h { 2 2 J 4 



2 r,-i* 



jc 1 

= , para 1 < x < 2, 

2 4 



F(x) = F( 2) + 



-r 2 3r 
— + — 
4 2 



(*-3)" 



f+oo 

F(x) = F(3) + J Q*f* = 1+0 = 1, six >3. 

La funcion de distribution acumulada y su grafica (fig. 6.10) son: 



F(jc) = 



0 si — oo < jc < 0 

x 2 /a si 0 <jc<1 

(2jc — l)/4 si 1 < x < 2 



(■* - 3) 2 



+ 1 si 2 < jc < 3 
si 3<jt<+oo 



X 



+ 1, para 2<x<3, 
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EJEMPLO 6.15. 

Si la funcion de densidad de una variable aleatoria continua X, es 




a) Determinar cl valor de la constante c. 

b) Hallar la funcion de distribution acumulada F(jc) de la variable aleatona X 

SOLUCION 



1. La funcion de distribution acumulada F(x) es no decreciente, esto es, para 
numeros reales X, y x 2 cualesquiera tales que jc, < jc«, , se tiene. 



En efecto, sean los eventos A = { X < jc, } , B = { X < x 2 } . Si jc, < x 2 , entonces 
AczB . Luego, P(A) < P(B) o F( jc, ) < F(x 2 ) . 

2 lim F(jc) = 0 y iim F(jc) = 1 

jt — >-oc x—>+°c 

A menudo, estos lfmites se escriben respectivamente: F(-oo) = 0 y F(+oo) = 1 
En efecto, el evento [X <-oo} = 0 (es imposible), mientras que el evento 
{ X < +oo} = Q (es seguro). 




resultando, c = P . Luego, 




b) Si jc<0, F(x) = 0 . Si x>0, F(x) = P[X <*]= [ ^‘dt = I -e~ Px 



f 0 



6.4. Propiedades de la funcion de distribucion 



F(x,)< F(x 2 ) 
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3. Para b numeros reales cualesquiera, tales que a < b, se tiene, 

P[a<X <b] = F(b)-F(a). 

Enefecto, si a < b. entonces. {X <b} = {X <a} + {a< X <b) 

Por el axioma P3) de probabilidades, resulta, 

P[X <b] = P[X <a] + P[a< X <b]. 

Portanto, P[a < X < b] = P[X <b]-P[X < a]= F(b)~ F(a ) . 

Observar que, si la variable aleatoria X es continua, entonces, 

F(b)-F(a) = P[a < X <b] = P[a < X <b\- P[a < X <b] = P[a < X <b]. 

4. Dada la f.d.a. Fix) de una variable discreta X, cuyos valores x i , estan ordenados 
en forma creciente, esto es, 

x \ <x 7 < *3 < • 

Entonces, la funcion de probabilidad fix) de X es deterrrunada por: 

/(*, ) = P[X = ^ ] = Fix, ) - F(x,_, ), i = 1,2,3,.. 
donde, F(x) = 0 para todo x < jc, 

En efecto, si jc, < jc 2 < Jt 3 <.... , entonces, 

P[X<x i ] = P[X<x,_ l ]+P\X=x l ] 
de donde resulta que para /' = 1,2,3,... 

/( v, ) = P[X = x t ] = P[X< X j ]-P[X< Xj_i ] = Fix,- ) - F(x M ) 

Por ejemplo, si la f.d.a. de una variable aleatoria discreta X se define por: 
F(jc) = 0 si x<0, F(jc) = 1/4 , si 0 <jc<1, F(jc) = 3/4, si 1 <jc< 2 y 
F(jc) = 1 si x > 2 . 

Entonces, la funcion de probabilidades f(x) resulta 
/(0) = F(0) - F(x ) = 1/4 - 0 = 1/4 
/(l) = F Cl) - Fi 0) = 3/4 - 1/4 = 2/4 
/( 2) = F( 2) -F( 1) = 4/4 - 3/4 = 1/4 • 
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5. Dada la f.d.a. F(x ) de una variable aleatoria continua X, entonces su f.d.p /(jc) 
es igual a la derivada de la f.d.a. con respecto a x , donde esta exista, esto es, 

/( jc) = — F(x), Vjc tal que — F(jc) exista • 
dx dx 

En efecto, si F{x) — f f(t)dt , entonces, /(jc) = F'(x) para todo x donde 

J— oO 

exista la derivada . 



EJEMPLO 6.16. 

Si la f.d.a. F(x) de una variable aleatoria X se define por: 

1 -ke~ x/s , si jc >0 
0, si jc < 0 

a) Hallar la constante k y la funcion de densidad de probabilidad. 

b) ^Para que valor de la constante c es P[ X > c] — 0.01 ?. 

SOLUCION. 

a) F{+ oo) — F( 0) = (1 — k x 0) — (1 — k x e° ) = 1 . entonces k = 1 . Luego, 

1/5<T' /S , si x>0 
0, si jc < 0 

b) 0.01 = P[X>c] = l-P[X<c] = 1-F(c) = l-(l-£“ t/5 ). 

De donde resulta , c = 23. 



f(x) = 



dF(x) 

dx 




EJEMPLO 6.17 

Si la variable aleatoria continua X tiene funcion de densidad: 

/(jc) = — , si 2< jc<6 
4 

y /(x) = 0en el resto. Determine la funcion de densidad de probabilidad de la 
variable aleatoria; Y = 3X - 4 . 

SOLUCION 



G(y) = P[y<y] = P[ 3X -4<>] = F[X 
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G(y) = F(x ) , donde jc = 



y + 4 



3 



dG(y ) _ dF(x) dx 
dy dx dy 




Luego, g(y) = — , donde 2 < y < 14 



EJEMPLO 6.18. 

Un experimento consiste en seleccionar aleatoriamente un punto en el interior 
de una region triangular isosceles cuya base mide 6 cm y cuyos lados iguales 
miden 5 cm. cada uno. Si X es la variable aleatoria que se define como la distancia 
del punto elegido a la base, hallar la funcion de densidad de X 

SOLUCION. 

Sea el triangulo ABC de la figura 6.11. La altura del triangulo es 



Como el punto se elige en el interior del triangulo, entonces el rango de X es el 
intervalo R% = ]0, 4[. 

La f.d.a. F(jc) de X esta dada por 



/j = >/25-9 =4 



F(x) = P[X <x] = - 



0 , 

area del trapecio AEFC 



si jc < 0 



si 0 < jc < 4 



area del triangulo ABC 

1 , 



si jc>4 



A 




C 



H 



3 



Fig. 6.11 



De la figura 6. 1 1 resulta. 
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Area del iriangulo ABC = 6x4/2 = 12. 



(6+ EF) 

Area del trapecio AEFC ~ (x) . 

Por semejanza de los triangulos BHC y BIF se tiene: 

EF 

IF Bl 2 __ 4 - jr 
HC~ BH~ 3 “ 4 

3jc 

de donde se obtiene ZTF =6 . 

2 



Luego, la funcion de distribution de X es: 



0 , 



F(x) = 



2 16 * 



si x<0 

si 0 < x < 4 
si jc>4 



Y la funcion de densidad de probabilidad es. 



/(*) = 



dF(x) 

dx 



\ x 

, si0<;t<4 

2 8 

0, en otros casos 
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jEJERCICIOS 



1. El numero de hijos por familia cn una determinada region es una variable 
aleatoria X cuya funcion de probabilidad es: 



X 


0 


1 


2 


3 


4 


P[X=x] 


1/16 


4/16 


k 


4/16 


1/16 



a) Calcular el valor de la consiante k. 

b) Si una familia tiene al menos dos hijos, £.cual es la probabilidad de que tenga 

3 hijos?- Rp a) t-6/16, b) 4/1 1 

2. Una urna contiene 10 fichas de las cuales 4 son rojas y 6 son blancas Se exlraen 

3 fichas al azar. Determine la distribucion de probabilidades del numero de 
fichas rojas. Si se escogen: 

a) Los 3 a la vez 

b) Una por una sin restitucion 

c) Una por una con restitucion 

Rp. a)X:0,l.2,3, P[X=k 1= C*€£* /Cj“ . b) X : 0, 1. 2. 3. P[X=k)= C, J C: , / 

c)X:0.1.Z3. P[X=k)= QW -1 /?= 4/10. <y=6 /!(> 

3. Se venden 500 boletos de una rifa que consiste de un premio de $200. 4 premios 
de $50, y 10 premios de $5 Si cada boleto cuesta 1$, y si Ud. adquiere un 
boleto, 

a) hallar la funcion de probabilidad de la utihdad. 

b) que probabilidad hay de ganar algun premio?. 

Rp. a> valores: 199. 49. 4.-1, prob.: 1/500. 4/500. 10/500. 485/500, b) 0.03 

4. Una caja contiene ocho focos de luz electrica. tres de los cuales son defectuosos. 

De la caja se selecciona al azar un foco y se la prueba, repitiendose la operation 
hasta que aparezca un defectuoso. Sea X la variable aleatoria que se define 
como el numero de extracciones necesarias hasta que aparezca el primer foco 
defectuoso. 

a) Determinar la distribucion de probabilidades de X . si las extracciones son sin 
reposicion. 

b) Hallar la funcion de distribucion acumulada F(x) de X si las extracciones 
son con reposicion 

Rp a) valores: 1, 2. 3. 4. 5. 6, probab 21/56. 15/56. 10/56. b/56. 3/56.1 /5b 
b) FU>=0. si v<(\ FLv)=I-( 5/8) a . k<x<k+ 1. 1.2,3. eic 
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5. Una caja contiene 7 bolas de las cuales 4 son blancas. Se seleccionan estas bolas 

una por una y sin reemplazo. Sea X el numero de selecciones necesarias hasta 
obtener todas las bolas blancas. 

a) Hallar la funcion de probabilidad de X. 

b) Calcuiar la probabilidad de que sean necesarios al menos seis selecciones 

Rp. Valores dc X: 4, 5, 6. 7. probabilidades: 1/35, 4/35. 10/35. 20/35. b) 30/35 

6. Urna que contiene 3 fichas rojas y 5 azules. Un juego consiste en extraer una 
ficha sucesivamente son reposicion. Si dos personas A y B juegan 
alternadamente extrayendo la ficha, hasta que ocurra una ficha azul. C cual es la 
probabilidad de que A gane el juego si el sale primero?. 

Rp X # de intenios hasta obtener la pnmera azul. P[X = k\ = q k p . k- 1.2... .etc. donde 

5/8. cj=VS P(A ganei=m=LX=3. X=5. etc. 1=8/ 1 1 



7. Se enumeran a 7 mujeres con los numeros 1 . 2, 3, 4. 5, 6, 7 y del mismo modo se 

enumeran a 7 hombres con los numeros 1, 2, 3, 4, 5, 6, 7. Cada mujer en forma 
ordenada elige a un hombre al azar. Sea X la variable aleatoria que indica el 
numero de mujer que elige al primer hombre con numero impar. 

a) £Que probabilidad existe de que sea la cuarta mujer la que elige al primer 

hombre impar? 

b) Halle la funcion de probabilidad de X. 

Rp. a) P[X=4]=P[FPPr]=l/35. b) X: 1. 2. 3. 4, probab 20/35. 10/35. 4/35. 1/35 

8. Una urna contiene 6 bolas numeradas de 1 a 6. Se extraen al azar dos bolas, una 
despues de otra con reposicion. Sea X el menor o igual de los dos numeros 
obtenidos. 

a) Encuentre la funcion de probabilidad de X. 

b) A partir de la funcion de distribucion acumulada de X , calcuiar 
P[2<X<4]. 

Rp. /UH 1 3~2\)/36, a= 1 ,2.3,4,5.6. b) 1 2/36 

9. Se suelta un cuy en el centro de cuatro cajas colocadas en cfrculo, una de las 
cuales contiene un premio. El juego termina cuando el cuy entra en la caja que 
contiene el premio. Determinar la distribucion de probabilidades del numero de 
intentos hasta conseguir el premio si se supone que el cuy, 

a) tiene memoria, b) no tiene memoria 

Rp. a) valores: 1. 2, 3, 4. probabilidad : 1/4. 1/4. 1/4. 1/4. b) />[*=*]=< 3/4) t_, ( 1/4). *=12. 3. 

10. Una urna contiene 3 bolas numeradas de 1 a 3. Un experimento aleatorio 
consiste en extraer las bolas una por una sin reposicion. Si se considera un exito 
cuando la bola k sale en la extraction k, k - 1 .2,3, 

aj determine la funcion de probabilidad del numero de exitos.. 

b) calcuiar la probabilidad de obtener al menos un exito. 

Rp. a) valores: 0.1.3. probabilidad: 2/6. 3/6, 1/6. b) 4/6. 
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11. Un objeto producido puede conlener, en forma independientc, a lo mas trcs 
tipos de defectos: A con probabilidad 0.04, B con probabilidad 0.08 v C con 
probabilidad 0.05. Si se selccciona al azar uno de tales objetos. 

a) ^.que probabilidad hay de que sea defectuoso?. 

b) hallar la distribucion de probabilidades del numero de defectos del objeto. 

Rp. a) 0. 1 6096, b) valores. 0, 1 , 2, y 3, prob: 0.83904. 0. I 5208. 0.00872 y 0.000 i 6 

12. Un vendedor puede visitar en un dia uno o dos clientes con probabilidades 2/5 y 
3/5 respectivamente. De cada visita en forma, independiente puede resultar una 
venta por $500 con probabilidad 1/6 o ninguna venta con probabilidad 5/6. Si X 
son las ventas diarias, calcular la media y la varianza de X. 

Rp. X montos dc ventas diarias Valores: 0. 500 1000. prob 45/60. 14/60. 1/60 

13. Del total de personas que se presentan para un puesto de trabajo el 60% son 
hombres y el resto mujeres. Aquellos que reunen todos los requisitos para dicho 
puesto son el 40% de los hombres y el 50% de las mujeres. De tres personas que 
se presentan 

a) Hallar la distribucion de probabilidades del numero de personas que cubrcn 
el puesto de trabajo. 

b) ^Cual es la probabilidad de que al menos dos personas consigan el puesto de 
trabajo?. 

Rp. a;/?=0.6x0.4+0.4x0.5=0 44. P[X=k]=C^ p k cj *=0.1.23. b>041. 

14. Una urna contiene n bolas numerados de 1 a n. Un juego consiste en extraer al 
azar tales bolas una por una con reposicion hasta volver a encontrar la primera 
bola repetida. Hallar el modelo de probabilidad del numero de bolas extraidas . 

Rp. P[X=*]=(*-I )( l-l//i) A 2 < I//1) 2 . 2. 3. etc 

15. Un bianco circular de radio 1 sc divide en 5 anillos circulares por medio de 5 
discos concentricos de radios: 1/5, 2/5, 3/5, 4/5, 1 . Un jugador lanza un dardo al 
bianco, si el dardo alcanza el anillo circular comprendido entre los circulos de 
radios kJ5 y (k+ 1)/5, k = 0,1, 2,3 ,4; tiene k puntos y gana 5 - k dolares. 
Determinar la distribucion de probabilidades 

a> del puntaje del jugador. 
b) de la utilidad del jugador. 

Rp. a) Valores de X 0,1,23.4. probab 1/25. 3/25, 5/25. 7/25. 9/25. b) valores Util: 5.43,2.1 

16. Una tienda comercial tiene dos computadoras en stock el viernes cn la manana. 
La tienda puede recibir mas computadoras solo hasta el dia lunes. Las 
probabilidades de que sean requeridas por los clientes 0, 1,2. computadoras el 
dia viernes son respectivamente: 0.5, 0.3. 0.2 y para el dia sabado son 
respectivamente: 07. 0.2. 0.L Si las demandas de los dos dfas son 
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independientes, determine la distribution de probabilidad del numero de 
computadoras que quedan al finalizar el dfa sabado. 

Rp. Valores: 0. 1,2. probabilidades: 0.34, 0.31, 0.35. 



Distribuciones continuas. 

17. El tiempo de espera (en minutos) de un pasajero en un paradero de omnibus en 
el intervalo [0, 5] es una variable aleatoria continua X cuya f.d.p. es : 

fc/5, si 0< x<5 
/(*) = <!' 

0, enelresto 



a) Halle el valor c y la funci6n de distribucion acumulada F(x) de X. 

b) Calcule la probabilidad de que el pasajero espere al menos 2 minutos. 

c) Calcule la probabilidad de que cl pasajero espere exactamente 2 minutos. 

d) ^Cuanto es el tiempo maximo de espera para que tome el 6mnibus con 
probabilidad 3/5?. 

Rp. a) t - 1 Ftr^O. si r< 0; F(x)=x/5. si 0< x < 5; F(x)- 1 . si .v>5, b) 3/5, c) 0, d) 3. 



18. Suponga que el tiempo de vida de una componenle electrdnica, en miles de 
horas, es una variable aleatoria X cuya funcion de densidad tiene la grafica 
siguiente. 




a) Determinar c y la funcion de densidad de X. 

b) Hallar la funcion de distribucion acumulada de X. 

c) Si el 95% de tales componentes duran a lo mas k miles de hora, halle k . 

Rp. a) c= 1/2,/U) = (4-*)/8 si CKr<4, b) F(.v)=l-(jr-4) 2 /16 si 0 <jc^ 4, c) 3.106 o 3106 horas. 

19. La proporcion de personas que contestan una encuesta por correo es una v.a. 
continua X con funcion de densidad de probabilidad: 

fc(2;t + lX si 0 < jc < 1 
[0, en el resto 

a) Hallar el valor de la constante c y la funcidn de distribucion F(x). 

b) Si contestan al menos el 25%, ^que probabilidad hay de que contesten a lo 
mas el 75%?. 

Rp. a) c = 1/2, F{x)H^x)!2 si 0<r<l. b) calcular P[X<0.75/^>0.25] = 16/27 = 0.59. 
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20, Suponga que el ingreso familiar mensual en miles de unidades monetarias 
(u.m.) en una ciudad, es una variable aleatoria X con funcion de densidad de 
probabilidad: 

[ 4k, si 0 < Jt < 1 

f(x) = \ 

|*(5-jr) f si 1 < x < 5 

a) Determine el valor de la constante k . 

b) Calcular el porcentaje de familias con ingresos mensuales de a *o mas 2 mil 

U.m.. Rp. a)*=!/12, b) 62.5%. 

21. La demanda semanal en miles de galones de gasolina en una estacion de 
servicios, es una variable aleatoria X cuya funcion de densidad de probabilidad 
se aproxima a la funci6n cuya grafica es la figura que sigue: 




a) Determinar la funcion de densidad de probabilidad de X. 

b) Hallar la funcion de distribution acumulada de X. Graficar 

c) ^Que cantidad de gasolina debe tener semanalmente la estacion de servicio 
para satisfacer la demanda en el 62.5% de las semanas? 

Rp. a) c=2/\ f{x)-2x/?i, si 0<*< 1 , f{x)=-{x-3 )/3 si l<x<3, f[x)~0 en otros casos, c) 1.5. 

22. Suponga que la demanda diaria de azucar en un supermercado es una variable 
aleatoria X con funcion de densidad de probabilidad: 

f kx, 0 < Jt < 500 

f(x) = < 

[k(\,000-x\ 500 < x <1000 

a) Determine el valor de la constante k. 

b) Calcular la probabilidad de que en un dfa cualquiera el supermercado venda 
entre 250 y 750 kilogramos. 

c) Calcular la cantidad Q de azucar que debe ser dejada al publico diariamente 
para que no falte azucar en el 80% de los dias. 

Rp. a) k = 500 -2 , b) 0.75, c) 683.77. 
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23. El tiempo en horas que una familia mira television durante el dia es una variable 
aleatoria X con funcion de densidad de probabilidad : 



7 horas. 

b) Determine la funcion de distribucion acumulada F(jt). Graficar F(x). 

Rp. a )k= 1/12, 11/12. 

24. El tiempo de vida en meses de un producto perecible es una v a. continua X con 
f.d.p.: 



a) Determinar el valor de la constante c y la f.d.a. F(x). 

b) Si [3=1/4, ^que probabilidad hay de que el producto dure al menos 4 meses?. 



25. La cantidad de tiempo, en horas, que una computadora funciona antes de fallar. 
es una variable aleatoria X continua, cuya f.d.p. es: 



Calcular la probabilidad de que la computadora funcione despues de 100 horas. 



26. La duracion, en decenas de horas, de cierta componente electronica es una 
variable aleatoria continua X , cuya f d.p es: 



kx y 



si 0 < x < 2 
si 2 < x < 6 
si 6 < x < 8 




0 , 



en otros casos 



a) Hallar k y calcule la probabilidad de que la familia mire television entre 1 y 




Rp. a) c = p, F{x) = 0, si * < 0; F(x)=\-e si*>0, b)03679. 



v 



f(x)-\ce 200 , si x>0 

0, en otro caso 



Rp. c = 1/200. 0.6065 




0, en otro caso 
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Si se prueban cuatro de estas componentes electronicas, calcular la probabilidad 
de que dos de ellas duren mas de 2,000 horas.(Suponga independencia en la 
duracion de las componentes). 

Rp. e=100 . p=P[X >200]=0.5. </=!-/). Prob = C*p 1 q 1 =0.375 
27. Sea X una variable aleatoria continua con funcion de densidad de probabilidad 



/U> = 



si 1 <jc<4 
3 



0 , 



en el resto 



determinar la funcion de densidad de probabilidad de la variable aleatoria 
Y = 4X -3 

Rp. G(y)=P[V<y]=P[4X-3<y]= P[X<(y+ 3)/4], g(v)=l/12, l<><13 



28. Si la distribution de probabilidad mixta de una v.a. X es desci ita por la grafica 
que sigue: 




Hallar la f.d.p./(jc) y la f. d.a. F(x). 

Rp. a=4/7. La f.d.p. es:/(jc)=0, si jc<-2, f[x)=-SLX-e^ si -2<x<-\, fix) =0. si 

f{ x) - -(ajc)/2 + a, si 0< x<\ % f[x)=a/2, si 1 < x<2. fix) = 0, si a>2. 
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6.5 Valor esperado o esperanza matematica. 

Las distribution de probabilidad de una variable aleatona se caracteiiza 
basicamente a traves de medidas de la tendencia central y de la dispersion. Estas 
medidas caracteristicas de la distribution denominadas parametros se describen 
por medio de la esperanza matematica. 

6.5.1 Media de una variable aleatoria 

La media de una variable aleatoria X o media de la distribucion de probabilidad 
de X es un numero real que se denota por \x x o por p. La media es denominada 
tambien esperanza matematica o valor esperado de X , y se denota tambien por 
E(X). 

Definition 1. La media de una variable aleatoria discreta X con funcion de 
probabilidad f(x) es la expresion: 

\i = E(X)= 

x,eR x 

Si el rango de X es el conjunto finito R x -{x Xi x 2 ,.-JC n } , entonces, 

n 

E(X) = J' l x i f(x j ) 

1=1 

Si el rango de X es el conjunto infinito numerable R x = { jc, , jc 2 entonces, 

00 

E(X) = 'X J x i f(x i ) 

1=1 

En este caso, si la suma indicada no es igual a un numero real, se dice que la 
esperanza de X no existe. 

Definition 2. La media de una variable aleatoria continua X con funcion de 
densidad de probabilidad f(x) es la expresion: 

/•+CC 

E(X)= xf (x)dx 

J—m 

siempre que el valor de la integral sea un numero real, en caso contrario, se dice que 
la media de X no existe. 

EJEMPLO 6.19 

Calcular la media de la distribucion de probabilidad de la variable aleatona X 
que se define como el numero de caras cuando se lanzan cuatro monedas. 
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SOLUCION. 

La distribucion de probabilidad de X se da en la tabla 6-3 



Tabla 6-3 





0 


1 


2 


3 


4 




1/16 


4/16 


6/16 


4/16 


1/16 



La media de X es el numero 

Esto significa que si una persona lanza 4 monedas, muchas veces, en promedio 
obtendra 2 caras por lanzamiento. 



NOTA. (Interpretation de la esperanza) 

Refiriendonos al ejemplo 6,19, supongamos que repetimos n veces el 
lanzamiento de las cuatro monedas y que se obtienen las frecuencias absolutas 
n o » > n 2 * n 3 y n 4 de l as veces que ocurren; 0, 1, 2, 3 y 4 caras respectivamente Lo 

que resulta es una distribucion de frecuencias cuyo promedio de caras por 
lanzamiento es igual a 



X = 



0x/iQ + lxrt2+2xn3+3xM 4 +4x/? 4 



. Ha „ ni ^ tu _ n* M n* 

= 0x — + lx— + 2x— + 3x — +4x — 



En el calculo de E(X) se usan probabilidades o proporciones teoricas, mientras 
que en el calculo de X se usan frecuencias relativas o proporciones empiricas 
obtenidas a partir de una muestra de tamano n. A medida que n vaya creciendo es 
de esperar que las frecuencias relativas empiricas : 

n 0 /n, n,/n f n 2 /n, n^/n y n^/n 

se vayan aproximando a las correspondientes probabilidades 1/16, 4/16, 6/16, 
4/16, y 1/16. En consecuencia, es de esperar que X se vaya aproximando a E(X ) 
a medida que n crece indefinidamente. Entonces, E(X) es la media que se obtiene a 
"largo plazo" o a la "larga" , en otras palabras es la media que se espera obtener 



NOTA. (Mediana y moda de una variable aleatoria). 

La mediana de una variable aleatoria X es el numero Me tal que: 

F(Me) = P[X<Me] = 0.5 
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Por ejemplo, acumulando las probabilidades ejemplo 6.19, resulta, 
F(x) = 5/16, para \ <x<2, y F(x) = 1 1/16, para 2<x<3. 

Luego en x = 2 puede ocurrir cualquier valor entre 5/16 y 11/16. En particular 
F( 2) = 0.5 . Por lo tanto, la mediana=2. 

Por otra parte, la moda de una variable aleatoria X , es el valor de la variable con 
mayor probabilidad (caso discreto), o donde alcanza su maximo (caso continuo). En 
la distribucion del ejemplo 6.19, la moda=2. 

EJEMPLO 6.20 

Suponga que en un juego al azar consiste en lanzar un dado y que el jugador 
puede ganar $7, si obtiene al menos 5 puntos, o perder $2 en caso contrario. 

a) ^Cuanto espera ganar en el juego el jugador?. 

b) ^Cuanto deberia ganar para que el juego sea justo?. 

SOLUCION. 

Sea la variable aleatoria Y, la cantidad de dinero que el jugador puede ganar. 
Entonces, los posibles valores de Y son: $7 si ocurre A = {5, 6} con probabilidad 
2/6, y -$2 si ocurre A c = { 1, 2, 3, 4}, con probabilidad 4/6. 

a) El valor esperado de Y es, E(Y) = -2 x 4/6 + 7 x 2/6 = 1 . 

En consecuencia, si el juego se repite indefinidamente, puede esperarse que el 
jugador gane en promedio $1 . 

b) El juego es justo si la esperanza es igual a cero, es decir si los esperados 
absolutos de ganar y de perder son iguales. Este juego sera justo si el jugador 
gana -solo $4 dolares en el juego. 

EJEMPLO 6.21 

Suponga que el numero de llamadas telefonicas que recibe una central en un 
periodo de tiempo, es una variable aleatoria X, con funcion de probabilidad: 



g-kyj. 

f(x)~ — , x = 0,1,2,..., etc., A,=constante 

x\ 

Calcular la media del numero de llamadas en ese periodo. 



SOLUCION. 



Utilizando la suma 




2 3 



00 



k 
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se obtiene 



E(X) = £xf(x) = ]T 



x LJ_ =Xe ^y 



.*=0 



.*=0 



x\ 



^(x-1)! 



= ke~ x e x =X- 



EJEMPLO 6.22. 

La vida util de un objeto en miles de horas, es una variable aleatoria continua X 
cuya funcion de densidad de probabilidad es: 



/(*H 




0 , 



si 0<Jt<2 
en el resto 



Calcular la esperanza de vida del objeto. 

SOLUCION. 



p+oO 

E(X ) - I xf(x)dx 
J-o0 




2 

3 



En consecuencia, puede esperarse que la vida util promedio del objeto sea de 
(2/3)1000 = 666.67 horas. 



EJEMPLO 6.23. 

Determine: 

a) la moda, b) la mediana 

de la distribucion de la variable aleatoria X definida en el ejemplo 6.22. 

SOLUCION 

a ) /( 0) = 1 es el valor maximo de la funcion de densidad (ver figura 6.12a ), 
luego, la moda = 0. 

b) La funcion de distribucidn acumulada de X es: 

jc 2 

F(x) = 0 si x<0, F(x) = x si 0 <jc< 2 y F(x) = \ si x>2. 

4 

La mediana es el numero Me que satisface 

F(Me) = 0.5 o P[X < Me] = 0.5 

(Me) 2 

Luego, F(Me) = Me = 0.5, con 0 < Me < 2 

4 

Resolviendo para Me se tiene: Me = 2 + V? . 
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Entonces, descartando el valor positivo, la mediana es Me = 2-^2 = 0.586 
(ver figura 6.12b). 





Figura 6 12 b) 



6.5.2 Media de una funcion de una variable aleatoria 

Sea X una variable aleatoria discreta con rango R x y funcion de probabilidad 
f(x) = P[X = x] . Entonces, la funcion Y = H(X ) , es una variable aleatoria con 
rango R Y =[y/H(x) = y} , y con funcion de probabilidad g(y) dada por: 

«(>■)* flK = v]= Y J P[X = x] 

{xeR x / Hix)=v) 

Por ejemplo, si X es una variable aleatoria cuya distribucion de probabilidad esla 
dada por la tabla 6.4, y si Y = H (X ) = 2X - 3 . entonces. 



Table 6.4 



X 


0 


1 


2 


3 


.fix) 


1/8 


3/8 


3/8 


1/8 



Y es una variable aleatoria, cuya distribucion de probabilidades es dada por la tabla 
6.5.donde g(y) = P[Y - H(x)\ - P[X = x] = f(x). 



Tabla 6.5 



H{ x) = 2x- 3 


-3 


-1 


1 


3 


g(y) = f(x) 


1/8 


3/8 


3/8 


1/8 



El valor esperado de H{x) es, 

£(//(X)) = ^ + ^ + | + | = ^//(x)/U). 
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Definition. Si X es una variable aleatoria con distribucion de probabilidad/UL la 
media o valor esperado o esperanza matematica de la variable aleatoria H(X) 
esta dada por la expresion: 

£(f/(X)) = ^//(Jc l -)/(jc l -) > si X esdiscreta. 



y por: E(H(X))~ I H(x)f(x)dx , si X es continua. 

J-OO 

Si la suma o la integral indicadas no son iguales a un numero real se dice que la 
esperanza de H (jt) no existe. 

EJEMPLO 6.24. 

Suponga que un juego consiste en lanzar un dado y que si se obtiene al menos 5 
puntos se gana $2, en caso contrario se pierde el numero obtenido en dolares. 

a) Defina la funcion utiiidad en el juego. 

b) Calcular la utiiidad esperada en el juego. 

SOLUCION. 

Sea X la variable aleatoria definida como "el puntaje obtenido al lanzar el dado", 
entonces X toma los valores 1,2,3,4,5,6. 

La distribucfon de probabilidades de X esta dada por la labia 6.7. 



Tabla 6-7 



k 


1 


2 


3 


4 


5 


6 


m 


1/6 


1/6 


1/6 


1/6 


1/6 


1/6 



a) La funcion utiiidad de este juego, es definida por: 

2 si x - 5,6 



U(x) 



i 2 



■ x si x — 1,2.3,4 
b) La esperanza de la funcion utiiidad es igual a: 

E(U(x)) = ^ lU(x)f(x ) =(-l)x — + (“2)x— + (-3)x — + (-4)x — + 2x — + 2x — ■ 
x=\ 6 6 6 6 6 6 



E(U(x)) = -I 

En consecuencia, si el juego se repite indefinidamente, puede esperarse que el 
jugador pierda en promedio $1. 
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EJEMPLO 6.25. 

Una tienda de comestibles comercializa diariamente un producto que compra a 
$8 y vende a $10 cada unidad. Debido a que el producto es perecedero, las unidades 
que se queden sin vender al final del dfa, se desechan; perdiendo ademas del costo 
$1 por unidad. El tendero ha establecido que la distribucion de probabilidades de la 
demanda diaria del producto es la que se da en la tabla 6-8 . 



Tabla 6-8 



Demanda: d 


0 


10 


20 


30 


40 


50 


Probabilidad 


1/10 


1/10 


2/10 


3/10 


2/10 


1/10 



a) Si el tendero comercializara 30 unidades diariamente, ^cuanto serfa su utilidad 
esperada?. 

b) ^Cuantos unidades del producto deberfa comercializar diariamente a fin de 
maximizar su utilidad esperada 7 . Utilice solo valores de la demanda 

SOLUCION. 



a) Si el tendero comercializa diariamente 30 unidades del producto, su utilidad 
para las demandas d = 0, 10, 20, 30, 40, 50, se da en la tabla 6-8b. 



Tabla 6-8b 



Demanda. d 


0 


10 


20 


30 


40 


50 


Probabilidad 


0.1 


0.1 


0.2 


0.3 


0.2 


0.1 


Utilidad 


-270 


-160 


-50 


60 


60 


60 



Observar que el calculo realizado se puede resumir en la funcion utilidad: 



Jl0x30-8x30, si d> 30 

\\0d -8x30 - 1 x (30- J). si d <30 



d= 0, 10, 20, 30, 40, 50 



La utilidad esperada en el caso que el tendero comercialice 30 unidades es: 
E{U) = (- 270 ) X 0.1 + (-160 ) X o.l + (- 50 ) x 0.2 + 60 x 0.3 + 60 x 0.2 + 60 x 0. 1 = -17 



b) Si el tendero comercializa diariamente * unidades del producto, se tienen las 
siguientes esperanzas (verificarl): si *= 0, E(U)=0, si *= 10, E(U)=9> si k= 20, 
E(U)= 7, si k= 30, E((/)=-17, si *=40, E(U)=- 74, y si *=50, E(lf)=- 153. 

El valor maximo de la utilidad esperada ocurre cuando *=10. Luego, el tendero 
debena comercializar diariamente 10 unidades del producto para maximizar su 
utilidad esperada. 

El calculo de las utilidades para * = 0, 10, 20, 30. 40, 50, se puede resumir en la 
funcion utilidad denotada por U(k % d ) o por U : 



|2*, si d >* 

[1L/-9*, si d<k 



d = 0, 10, 20, 30,40, 50 
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EJEMPLO 6.26 

Suponga que la vida util en anos de cicrto tipo de computadora es una variable 
aleatoria X con la funcion dc densidad: 

f 2 - 2 jc si 0< jc<1 

/« = n , , 

[ 0 en el resto 

El distribuidor ofrece una garantfa de 6 mcses. Si la computadora falla en cse 
periodo se reemplaza por otra, a lo mas una sola vez. Si cada computadora tiene cl 
costo de fabricacion de $400 y el precio de venta de $900, ^cudnto es la utilidad 
esperada por computadora? 

SOLUCION 



Vida util : X 


X<0.5 


X>0.5 


Probabilidad 


0.75 


0.25 


Utilidad 


$100 


$500 



Utilidad esperada: 0.75x1 00+0.25 x500=$200. 

EJEMPLO 6.27 

La demanda en miles metros de determinada tela que produce una compania 
textil es una variable aleatoria X que tiene funcion dc densidad siguiente: 

/(*) = — , si 0 <a<10 
10 

Si por cada metro xle tela vendida gana 4$, pero por cada metro de tela no 
vendida en la temporada sc pierde $1, ^cual es la produccion que maximiza la 
utilidad esperada de la compania?. 

SOLUCION 

Sea k el valor de la produccion tal que 0 < k < 10 . Si x es el valor de la demanda, 
entonces, la funcion utilidad denotada por U( v, k ) o por U es : 

|4a- — 1 x (A: — x) si 0<x<k 
\ 4 k si k < x < 10 

La utilidad esperada de la compania es entonces: 

r* r 10 c k 5 r — & r io al 

E(U) = I (5 x-k)f(x)dx+ I 4^/(a)^y- I dx+ | — dx 

Jo Jk Jo 10 j k 10 

E(U)= — + 4k = — — — ^ . Por grafica, E( U) es maximo en k = 8 . 

20 4 

Tambien, por el metodo de la derivada E(U) tiene valor max: mo si k = 8 
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6.5.3 Varianza de una variable aleatoria 

La varianza de una variable aleatoria X se denota por cualquiera de las formas: 
o 2 , a*. VaHX), WO. 

Definicion. Sea X una variable aleatoria con distribucion de probabilidad f(x) y 
con media igual a |i La varianza de X es la expresion: 

o x = E\(X -p) 2 ] = 7 > f . -p ) 2 f(Xj ) , si X esdiscreta, y 



2 ? p+oo 

a x =£[(X-p)“]= (x ~n)~ f(x)dx :. si X es continua. 

J-oo 

siempre que la suma y la integral sean numeros reales. 

Definicion. La desviacion estandar de la variable aleatoria X es la rai> cuadrada 
positiva de su varianza. Esto es, o x = 

Una de las propiedadcs de la varianza que se usa en el calculo es; 

var(X) = £[(X- M ) 2 ] = £(X 2 )- M 2 

EJEMPLO 6.28 

Calcular la varianza y la desviacion estandar de la distribucion de probabilidad de la 
variable aleatoria X que se define como el numero de caras al lanzar cuatro 
monedas. 

SOLUCION. 

La distribucion de probabilidad de X es la tabla 6-9 

Tabla 6-9 



*« 


0 


1 


2 


3 


4 




1/16 


4/16 


6/16 


4/16 


1/16 



En el cjemplo 6 . 1 9 , se ha calculado E(X)- 2 . Ademas, 

4 

^(x 2 )f(x)= 0 2 x 

16 16 



t , l 9 4 9 6 9 4 9 1 80 

E(X )-/ {x 2 )f(x)= 0 2 x — + 1 2 x — + 2 “ x — + 3 “ x — + 4“ x — = — = 5 

^ 16 16 16 16 16 16 



,v=0 



16 



16 16 
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Porlotanto, o 2 x = E(X 2 )- p 2 =5 - (2) 2 =1 



La desviacion estandar de X es: o x = yjVar( X ) = 1 . 

EJEMPLO 6.29 

Calcular la varianza y la desviacion estandar de la variable aleatoria discreta X 
cuya funcion de probabilidad es: 

e~ k X x 

f(x) = , x = 0,1,2,..., etc . , X — constante 

x\ 

SOLUCION. 

En el ejemplo 6.21 se ha calculado p = E(X ) = X . Adcmas, 

00 00 -X^x 00 -v jc — 1 » \k 

«x’) - V +i>- 

x=0 1=0 *■ Jt=l ' ’■ k = 0 



= A. 



* k — — +e * y_ — — = x(e + e *(e^))= X 2 + L. 

V *=o * • k=0 k ' j 

Luego, la varianza de X es. 

Var(X) — f(x 2 )- p 2 = X 2 + X - X 2 = X 



La desviacion estandar de X es 



a x =^Var(X) =Jk=\' /2 . 



NOTA. 

Otra forma de calcular esta varianza, es usando la siguiente expresion: 

g 2 x = E[X(X-l)]+p-p 2 

En efecto, p = X, y 

E[A , (A , -1)] = T *(*-1)— — = X 2 e~ x Y - 2 = >.W =X 2 . 



t=0 



r-2 



U-2)! 
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EJEMPLO 6.30 

La vida util de un objeto es una variable aleatoria X con funcion de densidad de 
probabilidad 



/(*) = 




si x>0 
si jc< 0 



calcular la varianza y la desviacion estandar de X. 
SOLUCION. 



Integrando por partes y analizando la convergence, se tiene: 






xp>e~^ x dx - Lim 

b-*+ oo 




+ Lim 

b->+co 





P 



El lector deberia verificar (integrando dos veces por partes) que 



E(X 2 )= [ + °° x 2 \Se~^*dx = -E 

Jo p 2 



Luego, o 2 = E(X 2 ) — \i 2 =-L !_ = _L_ 

P 2 P 2 P 2 



La desviacion estandar de X es: g - — . 

p 



6.5.4 Variables aleatorias independientes 

Definition. (funcion de probabilidad conjunta). Scan X e Y dos variables 
aleatorias discretas cuyos rangos son respectivamente 

R x = (x l> x 2 ,...,x„] R y ={>>,, v 2 

La probabilidad de que X e Y conjuntamente asuman los valores (jq,yj) se 
denomina probabilidad conjunta de X e Y. 

La funcion de probabilidad conjunta de X e Y es la funcion ftx>y) definida en 
el producto cartesiano R x x R y por 

/(*, * Yi ) — P[X =X; a K = y f ], para todo (jc t - , y f )^R X x &y 
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Si se define /(jt, y) = 0, para todo (x,y)eR x xRy* entonces la funcion de 
probabilidad conjunta satisface las propiedades: 

1 ) f(x , y) > 0, V(at, >•) e 1R 2 

2 ) ££ /(*.>’) = ! 

x y 

3) Para cualquier region A cn el piano XY , P[(X , Y)e A] = n /(*.>’> 

A 

Por ejemplo, se seleccionan al azar dos fichas de una urna que contiene dos 
fichas rojas, tres blancas y dos azulcs. Si X es el numero de fichas rojas e Y el 
numero de Fichas blancas, entonces, los posibles valores dc (X,L) son: (0.0), (0 1 ), 
(1,0), (1,1), (0,2), (2,0) y la funcion de probabilidad fix,y) esta dada por la tabla 
6.10. 



Tabla 6.10 



fix, y) 


x=0 


jc=1 


x~2 


total fila: h(y) 


>=0 


1/21 


2/21 


3/21 


6/21 


v=l 


6/21 


6/21 


0 


12/21 


>•=2 


3/21 


0 


0 


3/21 


Total columna: ^(x) 


10/21 


8/21 


3/21 


21/21 



Deflnicion: Si fix y y) es la distribucion conjunta de las variables X e Y. Las 

distribuciones marginales de X e Y estan dadas respectivamente por: 

«W = ^/(x,y), y h(y) = Y d f(*-y)- 
y x 

En la tabla 6.10, g(jc) se ubica en el total columna. mientras que h(y) se ubica en el 
total de fila. 

Las funciones marginales para variables aleatorias continuas X e Y cuya funcion 
de densidad de probabilidad conjunta es fix y y) y estan dadas respectivamente por: 

g( X)= f f{x,y)dy, y h(y)~ f f(x, y)dx 
JRy J/?X 

Deflnicion. Se dice que dos variables aleatorias discretas X e Y son 
estadistica men te indepen dientes, si los eventos: [X==Jt ( ] e [Y-yA son 

independientes para cada par (jc f , y f ) e R x x R Y . Esto es, X e Y son dos 
variables aleatorias independientes, si y s61o si. 

/(*/ , yj ) = P[X = Xi a Y = yj] = P[X = ]P[Y = y } ] = g(x ( )h( yj ) 
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para todo ( , y i )e R x x R Y . 

Definition. Se dice que dos variables aleatorias continuas X e Y son 
estadfsticamente independientes, si y solo si, 

f(x,y) = g(xMy) 

siendo ftx,y) la funcion de densidad conjunta de las variables aleatorias X e L, y 
#(•*), /z(y) las funciones marginales respectivas. 

NOTA. En general, si X,,X 2 ,..., X n son n variables aleatorias (discretas o 
continuas) independientes, entonces, 

/(*! , x 2 ,...,x n ) = f(x } )f(x 2 )...f(X n ). 

NOTA. La funcion H(X) de la variable aleatoria X, es una variable aleatoria 
Tambien la funcion G(X,L) de dos variables aleatorias X, Y, es una variable 
aleatoria. Por ejemplo, son variables aleatorias: 

G(X, L) = X + K G(X,L)=X-L, G(X, Y) = XY , G(X, Y) = X/Y . 



6.5.5 Propiedades de la esperanza matematica 

1. Si a y b son constantes reales, entonces, E{aX +b)- aE(X ) + b . 

2. Como consecuencias de la propiedad 1) se tienen: 

2a) E(b) = b 

2b) £(X +b) = E(X) + b 
2c) E(aX) = aE(X ) , 

3. Si X e K son variables aleatorias y a y b son constantes reales, entonces, 

E(aX+bY) = aE(X) + bE(Y). 

En particular se tiene: 

3a) E(X +Y) = E(X)+ E(Y ) , si a= 1 y b-l. 

3b) E{X -Y) = E(X)-E(Y) sia = lyfc = -l. 
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4. En general, si X x ,X 2 ... % X n son n variables aleatorias y a ly a 2 ...,a n son n 
constantes reales, entonces, 

n 
i=l 

5. Si X e Y son variables aleatorias independientes y a, b son constantes reales, 
entonces, 

E(aXbY) = abE(X)E(Y). 

6. En general, si X { ,X 2 ...,X n son n variables aleatorias independientes, 
entonces, 

E(X l X 2 ...X n ) = E(X l )E(X 2 )...E(X n ). 

6.5.6 Propiedades de la varianza 

La varianza es un numero real no negativo. Ademas se tiene: 

1. Var(X) = E(X 2 ) — \i 2 
En efecto, 

Var{X) = E[(X -\i)f =E[X 2 -2\xX + |i 2 ] 

Luego, ct 2 = E(X 2 ) - 2[iE(X) + ji 2 =E(X 2 ) — (i 2 . 

2. Si a y b son constantes reales, entonces, 

Var(aX +b) = a 2 Var{X) . 

3. Como consecuencias de la propiedad 2) se tienen 
3a) Var(b) = 0 si a - 0 

3b) Var(X +b) = Var(X) y sitf = l 
3c) Var(aX) = a 2 Var(X) 

4. Si X e Y son dos variables aleatorias independientes y a y b son dos constantes 
reales, entonces, 

Var(aX +bY) = a 2 V(X) + b 2 VQ'^ 






U-l 
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En efecto, 

Var(aX + bY) = E[(aX + bY) 2 ]-[E(aX +bY)] 2 

= E(a 2 X 2 + 2 abXY +b 2 Y 2 )- [ E(aX ) + E(bY )] 2 

= a 2 E(X 2 ) + 2 abE(XY) + b 2 E(Y 2 ) 

-a 2 [E(X )] 2 -2abE(X)E(Y)-b 2 [E(Y)] 2 

= a 2 [E(X 2 )-[E(X)] 2 ] + b 2 [E(Y 2 )-[E(Y)] 2 ] + 0 

= a 2 Var(X)+b 2 Var(Y). 

En particular si X e Y son variables aleatorias independientes: 
4a) Var(X + Y) = Var(X) + Var(Y) , s\ a = \ y b = \ 

4b) Var(X - Y) = Var(X) + Var(Y), si <3 = 1 y b = - 1. 



5.. En general, si X x , X n son n variables aleatorias independientes y 
d\ t a 2t ... y a n son n constantes reales, entonces. 




= ^a 1 2 V a r(X i ) 
1=1 



EJEMPLO 6.31 

El numero de defectos de un producto es una variable aleatoria X cuya 
distribucion de probabilidad se da en la tabla 6-11, 



Tabla 6-11 



X 


0 


1 


2 


3 


4 


5 


.fix) 


1/10 


2/10 


3/10 


2/10 


1/10 


1/10 



Si el costo del producto esta dado por la expresion. 

C = 4 + 2X -0.2X 2 

determinar el costo esperado del producto. 

SOLUCION. 

p = 0x0.1 + 1x0.2+ 2x0.3 + 3x0.2 + 4x0.1 +5x0.1 = 2.3 

E(X 2 ) = 0 2 xO.1 + 1 2 x0.2 + 2 2 xO.3 + 3 2 xO.2 + 4 2 x0.1+5 2 xO.l = 7.3 
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£(C) = 4 + 2E(X)-0.2E(X 2 ) = 4 + 2x 2.3 -0.2x 7.3 = 7. ] 4 



EJ EMPLO 6.32 

Un dado se tira n veces. Calcular el valor esperado, y la varianza de la suma 
de los puntos que resulten. 

SOLUCION. 



Si X i es el numero de puntos que resulta en la tirada i, siendo i=l,2 f 3.—w. 
Entonces, la suma de estas n variables aleatorias independientes, 

r-±*, 

i=l 



es la suma de los numeros de puntos que resultan de las n tiradas. Debemos calcular 
la esperanza y la varianza de la variable aleatoria Y. 

La distribution de probabilidad de cada variable aleatoria es dada en la tabla 

6. 1 2, de donde resulta: E(X t ) = 7 / 2 . 

Ademas, £(A', 2 ) = 91/6, 

Luego. Var(X' ) = E{Xj ) — ji 2 =91/6 - (7 /2) 2 =35/12 



Tabla 6.12 



X 


1 


2 


3 


4 


5 


6 


Ax) 


1/6 


1/6 


1/6 


1/6 


1/6 


1/6 



Luego, el valor esperado de la suma de puntos es: 



E(Y)=E 



f n \ n n ~ 



v 1=1 y i=i 



i=i 



Tn_ 

2 



y la varianza de la suma de puntos es: 

/ * \ 

V(Y) = V 



i=i J i=i 



35 n 
12 



EJEMPLO 6.33 

La vida util de una baterfa en anos es una variable aleatoria X con la 
funcion de densidad de probabilidad. 

f (x) = §.2e~° 2x , x>0. 

Si el costo del produclo esta dado por la expresion. 
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C = 80+2X +0.2X 2 
detcrmmar el costo esperado de la baieria. 

SOLUCION 

E(X) = — = 5. De ct 2 = E(X 2 )-p 2 = — ^-=25, resulta: E(X 2 ) = 50. 
0.2 ( 0 . 2) 2 

Luego, E(C) = 80 + 2£( X ) + 0.2£(X 2 ) = 80 + 2 x 5 + 0 2 x 50 = 100 



EJERCICIO. (Desigualdad de Chebyshev). 

Si X es cualquier variable aleatoria cuya distribucion f(x) tiene media \i y 
desviacidn estandar a , pruebe que : 

£[p-A:a< X <Sn + *a]>l-(l/* 2 ), *>0 

Prueba. 

<*p + ka T pp - ka f+cc 

P[\x -ko < X < p + &a] = I f(x)dx = \-\ I f(x)dx + I f(x)dx 
Jp - ka |_ v—€o Jp + Ice 

Por otra parte, 

o 2 =£](X-p) 2 ]= f f(x)dx+ f (x-\xf f(x)dx+ [ (x-[i) 2 f(x)dx 

J-oo Jp-ia Jp+lco 



, fM-to f +® , 

> I ( x - \iy f (x)dx + f(x)dx 

J - oo Jp + Jto 



7 7 7 fp-*a 7 . 

ct f(x)dx+ f(x)dx], sibc-p \>kc o(Jt-p)~ >k~o~ 

J-oo Jp + *c 

p+oo , ? 

De donde resulta: f(x)dx + I /(jtjcfr < \/k . 

j-oo Jp + Jtc 



NOTA. En particular si k = 2, P[p - 2a < X < p + 2a] > 3/4 Esto es. la 

probabilidad de que la variable aleatoria caiga dentro de dos desviaciones estdndar 
de la media no puede ser menor de 3/4 o el 75%. 

EJERCICIO. Si una variable aleatoria X tiene media =150 y varianza = 100, hallar 
una cota inferior para P[\00< X < 200] 

SOLUCION. La cota minima es 0.96. En efecto. 

£[100 < X < 200] = £[l X - 150 1< 5 x 10] > (1 - ^-) = 0.96 
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EJERCICIOS 



1. Suponga que el numero de cursos en que esta matriculado un alumno es una 
variable aleatoria X con funcion de probabilidad; 



X 


1 


2 


3 


4 


5 


f[x)=P[X=x] 


1/10 


2/10 


3/10 


3/10 


1/10 



a) Determinar la media y la varianza de la variable aleatoria X. 

b) Si todos los cursos son de cuatro creditos, determinar la funcion de 
probabilidad, la media y la varianza del numero de creditos. 

Rp. a) 3.1, 1.29, b) 12.4, 20.64. 

2. El numero de defectos que puede tener una ceramica, es una variable aleatoria X 
con funcion de distribution acumulada F(x) definida por la tabla: 



X 


x<0 


0<jt<l 


1 < x < 2 


2 < jc < 3 


x > 3 


F(x) = P[X <x] 


0.0 


0.4 


0.7 


0.9 


1.0 



Hallar a) la media, b) la moda, c) la mediana y d) la varianza de X 

Rp. a) 1, b) 0, c) 1, d) 1 

3. Suponga que una loterfa consiste de 1000 boletos que se venden cada uno a 
$0.25, y de 5 premios respectivamente de $25, $20, $10, $5, $1. 

a) ^Cuanto es la utilidad de la loterfa si se venden los 1000 boletos? 

b) Si Ud. juega esta loterfa muchas veces, comprando un boleto cada vez, 

^cuanto espera ganar?. Rp. a) $189, a) -0.189. 

4 . La probabilidad de que un pequeno negocio sea destruido por incendio en el 

perfodo de una ano es de 0.005. Una companfa de seguros ofrece al dueno del 
negocio una poliza de seguro contra incendio en el termino de un ano de 
$10,000, cobrando una prima de $250. ^Cuanto es la utilidad esperada de la 
companfa de seguros?. Rp. $200. 

5 . Suponga que usted compra 3 cuyes escogiendo al azar uno por uno de una caja 
que contiene 4 cuyes hembras y 6 cuyes machos. 

a) Hallar la media y la varianza del numero de cuyes hembras escogidas. 

b) Si paga S/.5 por cada cuy hembra y S/ 7 por cada cuy macho, hallar la 
media y la varianza de los pagos que usted realizarfa. 

Rp. a) 1.2’ b) media-S/. 18.6, varianza=S/.2.24. 
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6 Se escriben los nombres de 4 hombres y 3 mujeres en pedacitos de papel y se les 
coloea en una caja. Si se selecciona al azar uno por uno y sin reemplazo los 
papelitos de esta caja y se define la variable aleatoria X como el numero de 
selecciones hasta encontrar todos los nombres de los hombres. 

a) Halle la funcion de probabilidad de X. 

b) Calcule la media y la varianza de X 

Rp. a) valores de X: 4, 5, 6. 7. probabilidades: 1/35, 4/35. 10/35. 20/35, b) p=224/35, a 2 =0.64 

7. Un juego consiste en sacar una bola al azar sucesivamente y sin reposicidn de 

una urna que contiene cuatro bolas rojas y tres bolas blancas. Ud. pierde el 
juego si saca una bola roja. 

a) ^En cuantos intentos promedio pierde el juego?. 

b) Por participar en el juego Ud. paga $6, y gana (en dolares) una cantidad igual 
a 10 menos 2 veces el numero de intentos necesarias hasta obtener la bola 
roja. Si juega muchas veces, ^.cuanto espera ganar?. 

Rp. a) 1.6, b) $0.8. 

8. Una empresa saca al mercado cada sabado un nuevo producto cuya demanda 
semanal (en miles de unidades) es una variable aleatoria D con funcion de 
probabilidad: 

f(d) = P[D = d] = c d = 1,2,3 
d\ 

a) Calcular el valor de c y la demanda esperada del producto. 

b) El costo de produccion semanal tiene un costo base fijo de $5,000 y un costo 
variable de $1 por unidad producida. La empresa recibe $8 por unidad 
vendida, lo que no se vende durante la semana se descarta sin perdida 
alguna. Calcular la ganancia esperada de la empresa si cada semana produce 
2,000 nuevas unidades. 

c) ^Cuantas unidades deberia producir la empresa para maximizar su ganancia 
esperada?. Utilice solo valores de la demanda. 

Rp. a) c=3/16, (30/1 6)x 1000 =1875, b) 6,000$, c) *=1 da 2000, k = 2 da 6,000, *=3, da 70000 

9. La demanda semanal de un articulo que produce una companfa varfa 
grandemente de una semana a otra. De acuerdo con la experiencia, la demanda 
semanal y las respectivas probabilidades son las siguientes: 



Demanda 


2,000 


3,000 


4,000 


5,000 


Probabilidad 


0.3 


0.4 


0.2 


0.1 



a) ^Cuantas unidades de dicho articulo debe producir la companfa 
semanalmente, si decide programar la produccion tomando como base: 
al) la demanda mas probable?. a2) la demanda esperada? 
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b) Si cada unidad tiene un costo de S /. 5, se vende a S/.10 y si no se vende en 
la semana se debe desechar perdiendo S/.2.5 ademas del costo, ^cuanto es la 
utilidad esperada si produce 3,000 unidades?. 

c) ^Cuantas unidades debe producir semanalmente la companfa a fin de 
maximizar su utilidad esperada?. Utilice solo valores de la demanda 

Rp. al) 3000, a2) 3100, b) utilidad: 2500, 15000, 15000, 15000, Medians/. 1 1,250 . c) 2,000 da 
S/. 10,000, 3000 da S/.l 1.250. 4000 da S/.7500. 5.000 da 1250. la maxima para 3000 

10. Usted ha arribado con dos maletas al control de equipajes de un aeropuerto 
junto con otros pasajeros. En el control se sigue la siguiente polftica: Se 
seleccionan al azar a 3 pasajeros para una revision automatizada de sus maletas. 
Estos 3 pasajeros son ordenados al azar y sus maletas revisadas La revision de 
una maleta dura 3 minutos. Si usted es seleccionado y observa que los otros 2 
pasajeros seleccionados tienen respectivamente 1 y 3 maletas, halle la media y 
la varianza del tiempo que usted se demorara en salir de este control 

Rp. X tiempos : 6, 9. 15. 18. prob: 1/3. 1/6, 1/6, 1/3, E(X)-\2, V(X)=27. 

11. Un juego consiste en extraer al azar una ficha tras otra sin reposicion de una 
urna que contiene 2 fichas rojas y 3 azules. 

a) Hallar la ley de probabilidad del numero de extracciones hasta obtener la 
segunda ficha azul. 

b) Si por el numero de extracciones X se gana G-( 40/X)-10 hallar el valor 
esperado del juego, ^serfa usted un asiduo concurrente a este juego? 

Rp. X:# de intentos hasta obtener 2da azul. a) Valores. 2. 3, 4, prob: 36/1 20, 48/120, 
36/120. b)G: 10, 10/3,0, £(G)= 10x36/120+10/3x48/120+0=4.33, si. 

12. Un comerciante recibe para su venta, un lote de cajas de 12 artfculos cada 
una. El ha descubierto en anteriores entregas que hay un 25% de artfculos 
defectuosos por caja. Su control de calidad por caja, consiste en escoger 3 
artfculos al azar uno a uno y sin reposicion. Si los tres artfculos escogidos no 
son defectuosos, no sigue probando el resto de la caja, pero si al menos uno de 
los 3 es defectuoso debe probar todos los artfculos de la caja. Si se controlan 
muchas cajas, calcular el numero esperado de artfculos a probar por caja. 

Rp. X: # artfculos a probar, valores: 3, 12 , prob: 42/1 10, 68/1 10, E(X)= 8.5636. 

13. Un inspector A selecciona tres artfculos al azar y a la vez de un lote de 50 
artfculos que contiene 5 defectuosos, anota el numero de defectuosos hallados y 
repone los tres artfculos al lote. Luego, el inspector B selecciona dos artfculos 
uno por uno y sin reposicion y anota el numero de defectuosos hallados. 
Determine la media de la distribution de probabilidades del numero total de 
defectuosos encontrados por los inspectores A y B 

Rp. X: 0J,2,3,4,5, prob: D-480200: 280962/D, 161865/D.. 34023/D, 3213/D, 135/D 2/D, p=0.5. 

14. Una companfa se seguros propone asegurar cierta marca de automovil del ano 
en $20,000. La companfa estima que una perdida total puede ocurrir con una 
probabilidad de 0.001, una perdida del 50% con una probabilidad de 0.02, una 
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perdida del 25% con una probabilidad de 0.2. Si se ignoran las demas perdidas 
parciales, ^que prima debe cobrar la compama de seguros si espera una ganancia 
de $200?. Rp. $1,420. 

15. Un inversionista debe decidirse por uno de los dos proyectos: A o B. Si 
invierte en el proyecto A, puede ganar $41,000 si lo administra bien o perder 
$10,000 en caso contrario. Si invierte en el proyecto B, puede ganar $20,000 si 
lo administra bien o ganar $2,000 en caso contrario. Si las probabilidades son de 
3 a 2 de que no lo administre bien, 

a) ^cual de los proyectos deberia tomar de manera que el beneficio esperado sea 
maximo?. 

b) ^cuanto deberfa ganar en el proyecto B si lo administra bien de manera que 
el beneficio esperado sea igual al del proyecto A?. 

Rp a) A, ya que espera ganar $ 10,400 contra $9,200 de B, b) 23,000. 



Continuas 

16. El costo C de un proyecto, en miles de dolares, esta dado por: C = 3X +5X 2 , 
siendo X el tiempo empleado, una variable aleatoi ta que verifica: 

E[(X- 1/2) 2 ] = 13/4. y E[(X-1) 2 ]=2 

a) Determinar la media y la varianza de X 

b) Calcular el costo esperado del proyecto. 

Rp. a) £(X 2 )=5, E{X)= 2, Var(X)=\ t b) $31,000. 



17. Una producto qufmico contiene una proporcion X de cierto elemento por litro. 
El producto se vende a $6 litro si la proporcion del elemento es menor de 50% y 
a $8 en caso contrario. Si el costo del producto es de $5 por litro y si X es una 
variable aleatona con funcion de densidad. 



/(*> = 




0 < jc < 1 
en otros casos 



hallar la funcion de probabilidad de la utilidad por litro y la utilidad promedio 
per litro. 

Rp. t-2. valores: 1 y 3, probab; 0.25, 0.75, esperado S2.5. 

18. Suponga que en cierta region el ingreso anual por persona en miles de dolares es 
una variable aleatoria X con funcion de densidad: 

f 4cx si0<*<l 
/(*) = \ 

[c(5-*) sil<*<5 
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a) Hallar el valor de c. 

b) Si se impone un impuesto de $20 a los ingresos de menos de mil dolares, de 
$50 a los ingresos de mas de tres mil dolares y de $40 a los otros ingresos, 
calcular la recaudacion anual esperada por persona. 

c) Si el impuesto es del 20% a los ingresos de menos de mil dolares, del 50% a 
los ingresos de mas de tres mil dolares y del 40% a los otros ingresos, 
^cuanto es la recaudacion anual esperada por persona?. 

Rp. a) c=I/10, b) R: 20, 40, 50, prob.: 1/5, 3/5, 1/5, £(/?)=$ 380, c) £(/0=0.8466 o S846.6 



19 . Sea X una variable aleatoria con funcion de densidad de probabilidad; 

f 2 jc/ 9 . si 0 < x < 3 

/u>«L 

[0, en otros casos 

a) Calcule la media, la mediana y la moda de X. 

b) Halle la media y la varianza de la variable aleatoria, Y = 2X - 3. 

Rp. a) media=2, mediana= 3/-\/2 , moda=3, b) £fK)=l. V(Y)=2. 



20. Suponga que el tiempo de atencion (en nunutos) a los clientes en la ventanilla 
de un banco, es una variable aleatoria X con funcion de densidad de 
probabilidad: 

, f ce~ x ^ , si x>0 

/U)H 

[0, en otro caso 

a) Calcular la media p y la desviacion estandar a de X. 

b) Determinar la mediana de X 

c) Calcular P[p-2o<X <p + 2o] directamente, y utilizando la desigualdad 

de Chebyshev. Rpx-I/3. a) 3. 3. b) 2.079. c) 0.95. >3/4. 



21 . Suponga que la vida util (en horas) de cierta marca de "foco electronico", es 
una variable aleatoria X cuya funcion de densidad de probabilidad es: 



/(*) = 



1 



8000 



8000 

0 , 



si x > 0 



en otro caso 



a) Calcular la vida util promedio por foco y la desviacion estandar de X. 

b) Si el costo C, en dolares, por cada foco esta dado por: 



C — 20 -i — — 1- 2 

4,000, 



X 2 

(8,000) 2 



determine el costo promedio por foco. Rp. a) 8.000. y 8.000. b) $26 



22 . Un agente de bienes raices cobra honorarios fijos de S/.200 mas una comision 
de 5% sobre el beneficio obtenido por el propietano. Si el beneficio del 
propietario es una variable aleatoria X con funcion de densidad de probabilidad 
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/(*> = 



1 

< 2000 
0 ^ 



0 < jc < 2000 
en el resto 



a) ^Cuanto espera obtener de utilidad el agente? 

b) ^Que probabilidad hay de que obtenga utilidades superiores a S/.275? 

Rp. a) U= 200+0.05*. E( ^=200+0.05 E(X)=20(H50=250, b) P[ U>275]=P[X> 1 50Q]=0.25 



23. Un agente de bienes rafces gana S/.1000 mas una fraction X de la ganancia que 
desea obtener el propietario. Si se considera a X como una variable aleatoria 
continua con funcion de densidad 

fiAjc(l-jr) si 0<*<1 
[0 en el resto 

y un propietario quiere ganar 25000. 

a) ^Cuanto se espera que gane el agente? 

b) *Cual es la probabilidad de que el agente gane mas de 1 1 ,000?. 

Rp. 4=6, E(X)=0.5, G= 1 000+25000*, a) £(G)=100a+25000E(*)= 13,500, 

b) f*[G>l 1 000]=f , (A’>0.4]=0.648- 



24. La vida util de una bateria en anos es una variable aleatoria X con la f.d.p. 

f(x) = 0.2e~°' 2x , x>0 

El fabricante ofrece una garantia de un ano. Si la bateria falla en ese periodo se 
reemplaza por otra, a lo mas una sola vez. Si el costo de fabrication es de $20 
por cada bateria y se vende a $50 cada una 

a) ^Cual es la utilidad esperada del fabricante? 

b) ^Cual debe ser el tiempo de garantia que el fabricante debe ofrecer para que 
solo devuelva el 5% de las bateria producidas?. 

Rp. a) 30(e* Vl0(l-e° 2 ), b) 0.05 =/>[*£*]. *=0.2565 

25. La proportion de pureza X por galon de un compuesto que produce una empresa 
es una variable aleatoria con funcion de densidad: 

/ U ) = { 3 *‘ °^ x ^ 1 

{ 0 en otros casos 

Si la proportion de pureza del compuesto es menor o igual a un nivel k , el 
compuesto se destina a un fin A obteniendose una utilidad de 50 dolares por 
galon. En caso contrario, el compuesto se destina a un fin B obteniendose una 
utilidad de 60X dolares por galon. Determine el nivel k que le permita a la 
empresa maximizar su utilidad esperada por galon 

Rp. Y: utilidad, K=50 si 0<x< K y y=60jr, si *<r< I; E(>')=50* 3 +45-45*'\ E{Y) es m£ximo si 

AT=150/180 
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26. La demanda en miles metros de determinada tela que tiene una companfa textil 
es una variable aleatoria X con funcion de densidad de probabilidad: 



/(*) = 



\_ 

4 5 
0 



si 0 < x <5 
en el resto 



Por cada metro de tela vendida se gana 3$, pero por cada metro de tela no 
vendida en la temporada se pierde $1. Calcular la produccion que maximiza la 
utilidad esperada de la compania. 

Rp. X: demanda, sea K la produccion Y: utilidad. Y=3K si K<\< 5. Y=3x-\{K-x) si 0<\<K 

E(Y)= C-2AT-/5 )-*-3AT. E(Y) cs maxi mo si K= 15/4. 



27. La duracion en horas de una tarjeta electronica de una computadora es una 
variable aleatoria X con funcion de densidad: f(x) = e~' % si a>0. La 
computadora que usa esta componente produce un gasto dc $a por hora para 
funcionar. Mientras la computadora esta funcionando se obtienc una ganancia 
de %b por hora. Un operador de la computadora es contratado por H horas y sc le 
paga $c por hora. 

a) Defina la utilidad y determine la utilidad promedio. 

b) ^Para que valor de H es maxima la utilidad promedio?. 

Rp. a) U: utilidad U -bx-ax-cH si x<H y Li —bH-aH-cH si \>H 

E(U) = (b-a)\He~ H + 1 - e~ H (H ^ 1 )] - cH . c) H = ~lnu/</> - u)) 

28. Sea X una variable aleatoria con funcion de distribucion acumulada 



X 


jt < 0 


0 < jt < 1 


\<x<3 


A >3 


F(x) = P[X <x] 


0.0 


x~/2 


(.r+ 1 )/4 


1.0 



Calcular la media y la varianza de X. Rp. p=4/3 y <r ^0.639 

29. Si X es una variable aleatoria con media 30 y varianza 9 usando el teorema de 

Chebyshev. hallar el valor de c tal que P[|A r -30|>c]<0. 1 6 Rp. *=3x2.5 

30. Si X e Y son dos variables aleatorias independientes, probar que: 

Vcir( X±Y) = Vcir( X ) + Vciri Y ) . 

31. Si X es una variable aleatoria que tiene media p y desviacion estandar a hallar 
la media y la varianza de la variable aleatoria estandar: 

Z = ( X - p)/a ^ Rp- aZH). VariZ) = i . 

32. Sea X cualquiei variable aleatoria. Si E[(X -c) 1 ] existe. calcular el valor de 

la constante c que la haga mfnima . Rp. r = E{ X » . 
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Introduction 

El comportamiento de una variable aleatoria queda descrita por su distribution 
de probabilidad. 

En muchas tareas estadi'sticas, se busca determinar una distribution de 
probabilidad o modelo probabilistic^ que satisfaga un conjunto de supuestos, para 
estudiar los resultados observados de un experimento aleatorio. 

Se pueden definir muchas distribuciones de probabilidad tanto de variable 
aleatoria discreta como de variable aleatoria continua. Algunas, que tienen 
aplicaciones estadfsticas importantes y que se estudiaran a continuacion son: 



Discretas: 

Bernoulli' 

Binomial 

Geometrica 

Pascal 

Hipergeometrica 

Poisson 



Continuas: 

Uniforme 

Normal 

Gamma 

Exponencial 

Chi-cuadrado 

t y F 
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7.1 ALGUNAS DISTRIBUCIONES IMPORTANTES 
DE VARIABLES ALEATORIAS DISCRETAS 

7.1.1 Distribution de Bernoulli — 

Definition. Se denomina prueba o ensayo de Bernoulli a todo experimento 
aleatorio que consiste de solo dos resultados posibles mutuamente excluyentes, 
generalmente llamados: exito (F) y fracaso (F). 

Por ejemplo, son ensayos de Bernoulli, lanzar una moneda al aire con Ios 
resultados: cara o sello. Elegir al azar un objeto fabricado, con los resultados: 
defectuoso o no defectuoso, etc.. 

El espacio muestral asociado al experimento aleatorio de Bernoulli se puede 
escribir como el conjunto: Q = {F, F} . 

Definition. La variable aleatoria X dcfmida en Q de manera quc atnbuye a E el 
valor 1 y a F el Valor ), se denomina variable aleatoria de Bernoulli. 

Definition. Si p = P[X = 1] es la probabilidad de exito , donde 0 < p < 1 , y 
<7 = P[X=0] = 1 — p, es la probabilidad de fracaso , la distribution de 
probabilidad de Bernoulli de parametro p , es descnta por la tabla: 



X 


0 


l 


fix) 


q 


p 



o por la ecuacion: 

f(x) = P[X=x]=p*q'- x , X = 0,1 . 



La funcion de distribution acumulada de Bernoulli es: 



0, si x < 0 



F{ Jt) = 



9 . 



1 . 



si 0<x<l 
si x>\ 



TEOREMA 7.1. 

Si X tiene distribucion de Bernoulli de parametro p, entonces, 
a) E(X) = p, b) Var(X) = pq. 

PRUEBA. 

a) p = E(X) = 0x (1 - p) + lx p= p. 
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b) a 2 =E(X 2 )-n 2 =[(0) 2 (l-p) + (l) 2 (p)]-p 2 =p-p 2 = pq. 



NOTA. 



la varianza de la distribucion de Bernoulli es menor o igual que 1/4, en efecto, 



7.1.2 Distribucion Binomial 

Definicion. Se denomina experimento binomial a un numero fijo, n, de 
repeticiones independientes de un experimento aleatorio de Bernoulli, y por lo 
tanto, se caracteriza por que: 

1. Las n pruebas son estadisticamente independientes. 

2. Los resultados de cada prueba son dos mutuamente excluyentes, exito (E) y 
fracaso (F). 

3. La probabilidad p de exito es invariante en cada una de las pruebas. 

El espacio muestral del experimento binomial es el conjunto: 



Definicion. Se denomina variable binomial a la variable aleatoria X definida en Q 
como el numero de exitos que ocurren en las n pruebas de Bernoulli. Los posibles 
valores de X son: 0, 1 , 2, 3, . . . , n. 

Si k es cualquier valor de la variable binomial, el evento [X = k] consiste de todos 
los elementos de Q que contengan k exitos(E) y n — k fracasos (F). La 
probabilidad de cada uno de estos eventos elementales es igual a p k q nk El 
numero de estos eventos elementales es igual a: 



Para verificar que la suma de las probabilidades binomiales es igual a 1, se 




Q = {(w,,w 2 ,...,w n )/ w- =F 6 F). 




k\(n-k )! 



n\ 



Por tanto, la probabilidad de obtener k exitos en n pruebas Bernoulli es. 



P[X " pV~*. * = 0,l,2,3,...,n. 

I j 



utiliza el binomio: I C r }a k {b) n k =(a+b) n .En efecto, 
k= 0 
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£[” V a - />)"'* =(p+a- p))" = o) n = i- 



Definicion.- Se dice que la variable aleatoria X definida como el numero de 
exitos que ocurren en las n pruebas de Bernoulli, tiene distribucion binomial 

con parametros n y p y se escribe X ~ B(n,p), si su funcion de probabilidad es: 



f(k) = P[X=k] = 






p k q nk , k =0,l,2,3.---i«- 



Observar que si n = 1 , la funcion de probabilidad B( 1, p) es de Bernoulli. 
La funcion de distribucion acumulada de la variable aleatoria binomial es: 



F(x) = P[X < x] = 



0, si x < 0 

xf"V* qnk ' s * jc= °’ 1 ’ 2 n ~ i 

si x > n 



*= o 

1 , 



NOTA. Sean X x , X n , n variables aleatorias independientes de Bernoulli 

con distribucion B(\, p) para cada i =1,2,3,..., n . Entonces, la suma de estas n 
variables aleatorias independientes representa el numero de exitos en n ensayos de 
Bernoulli, esto es, la variable aleatoria: 

*= 2 >, 

i=i 

cuyos valores son: 0,1,2,..., «, tiene distribucion Binomial B(n , p) . 

TEOREMA 7.2 

Si X ~ B(n , p ) , entonces, 

a) p = E{X) = np , b) o 2 = Var(X) = npQ - p ) . 

PRUEBA. 

La variable aleatoria X y numero de exitos en n ensayos de Bernoulli se puede 
escribir como una suma de n variables aleatorias independientes de Bernoulli 
X t , esto es, 

i=i 
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siendocada X t de Bernoulli con: E(Xj) = p y Var(Xi) ~p(\-p) 
Luego, 

f n \ 

a) p = E(X) = E 



2>, =^£(x i) =5;p=«p. 



V i=l / /=! 



i=l 



^ n A /i n 

b) c 2 =Var(.X) = Var = £Var(X, ) = £ p(l - p) = np(l- p). 

^ 1=1 y i=i «=i 



NOTA. Si p = 1/2 , la distribucion binomial B{n, p) es simetrica. Ademas, si 
p-> l , la distribucion tiene asimetna negativa (cola a la izquierda), y si p -» 0 , 
la distribucion tiene asimetna positiva (cola a la derecha). 



EJEMPLO 7.1 . 

La probabilidad de que cierto tipo de objeto pase con 6xito una determinada 
prueba es 5/6. Se prueban 10 de tales objetos. Si X es la variable aleatoria que se 
define como el numero de objetos que no pasan la prueba: 

a) Determine la funcion de probabilidades de X. 

b) Calcule la media y la desviacion estandar de X. 

c) Determine la funcion de distribucion acumulada F(x) de X. 

d) Usando F(jr), calcular P[1 <X<9]. 

SOLUCION. 

a) Cada uno de Ios objetos puede no pasar la prueba (£) o puede pasar la prueba 
(F). La probabilidad de que el objeto no pase la prueba es 1/6 y de que pase la 
prueba es 5/6. La distribucion de probabilidad X es entonces. 



f(k) = P[X 



= k] = 



mxr 



k =0.1,2,3»— .10 



b) La media de esta distribucion es \x-np- 10(1/6) = 1 .667 
Su desviacion estandar es: 



o = <Jnp(\-p) = /lOj-i Iff 




6 A 6, 



1.1785. 



c) Su funcion de distribucidn acumulada F(;c) es: 
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F(x) = 




si x < 0 

, si i < x < i + 1, i = 0,1,23,- ..,9 



1 , 



si x^lO 




= 0 . 000 . 



EJEMPLO 7.2. 

En una tienda de alquiler de autos, cada vez que un cliente alquile un automovil 
debe pagar como minimo $4. Si alquila un auto tipo A debe pagar $15 mas, y si 
alquila un auto tipo no A debe pagar $5 mas. Se sabe que la probabilidad de que un 
cliente alquile un auto tipo A es de 0.7. De cinco clientes que alquilan autos en esta 
tienda: 

a) Determine la distribucion de probabilidades de los clientes que alquilan 
automoviles tipo A. 

b) Determine la utilidad y la utilidad esperada que producen a la tienda los 5 
clientes que alquilan automoviles. 

SOLUCION. 

a) Sea X el numero de clientes que alquilan automoviles tipo A. Entonces, los 
valores posibles de X son: 0, 1 , 2, 3, 4, 5. 

La probabilidad del evento, E : "un cliente alquila un automovil tipo A" es 
P(E) = 0.7 y P(E F) = 0.3. La distribucion de probabilidad de X es: 



/(*) = P[X = (0.3) 5 ~* . k = 0,1,2,3,4,5. 



b) La utilidad U que producen los cinco clientes es: 

V - 2J3+ 15X + (5 - X)5, jc = 0,1,23,4,5. 



Dado que E(X ) = tip = 5 x 0.7 = 3.5 , la utilidad esperada es: 
E(U ) = 45 + 1 0E( X ) = 45 + 1 0 x 3.5 = 80. 



EJEMPLO 7.3. 

Suponga que una produccion de polios bebe ha dado 10% de pollitos hembras 
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a) Si la production es llenada al azar en cajas de n polios bebe cada una, hallar 
el valor de n de manera que la probabilidad de que no haya polios bebe 
hembras en la caja sea igual a 0.08 

b) Si cada caja contiene 24 polios bebe, hallar la ley de probabilidad del 
numero de polios bebe hembras por caja, ^cual es el numero esperado de 
pollitos hembras por caja?. 

c) Si un criador de polios recibe para su venta 20 cajas de 24 polios bebe 
cada una, hallar el modelo de probabilidad del numero de cajas que no 
contengan pollitos hembras, ^cual es el numero esperado de cajas que no 
contengan polios bebe hembras ?. 

SOLUCION. 

a) Sea X el numero de polios bebe hembras por caja de n polios bebe. Los 
valores posibles de X son: 0, 1, 2 

La probabilidad de que un polios bebe de la production sea hembra es 
p = 0.1. Entonces, cada polios bebe es colocado en la caja con probabilidad 
p =0.1 de que sea hembra y con probabilidad q = [- p =0.9 de que no sea 
hembra. Ademas las selecciones son independientes, esto se debe a que el 
numero de polios bebe producidos se considera muy grande. Luego 
X ~ £(/i,0.1). 

Debemos hallar el valor de n tal que P[X = 0] = 0,08 . Entonces, de 
P[X =0] = (^”(0.1)°(0.9)" =0.08, resulta n = 23.976 = 24 



b) Sea Y el numero de pollitos hembras por caja de 24 pollitos. Los valores 
posibles de Y son: 0, l, 2,. ..,24, Luego, Y ~ Z?(24, 0 1) , esto es: 

P[Y = A:] = (f* (0. 1)* (0.9) 24 “* , k = 0, 1, 2, 3,..., 24. 

El numero esperado de pollitos hembras por caja es: np = 24x0.1 = 2.4. 

c) Sea W el numero de cajas que no contengan pollitos hembras. Entonces, 
W ~ B( 20, p) , donde p la probabilidad de que cada caja no contenga pollitos 
hembras en este caso es: 

p = P[Y = 0] = (0. 1)°(0.9) 24 = 0.0798 

El numero esperado de cajas que no contengan pollitos hembras es: 
np = 20x0.0798= 1.596=2. 
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7.1.3 Distribution Geometrica 



Definition. Se denomina experimento geometrico a las repeticiones 
independientes de un experimento aleatorio de Bernoulli hasta obtener el primer 
exito. En cada ensayo de Bernoulli puede ocurrir un exito ( E ) con probabilidad p 
o un fracaso (F) con probabilidad q — 1 - p , siendo 0 < p < 1 
El espacio muestral del experimento geometrico es el conjunto: 



Definition. Se denomina variable geometrica a la variable aleatoria X definida 
como el numero repeticiones independientes de un ensayo de Bernoulli hasta que 
resulte el primer exito. Los posibles valores de X son: 1, 2, 3,..., etc.. 

Si A: es uno de los valores de la variable, el evento, [X — k] consiste del suceso 

elemental de Q que contenga los primeros k - 1 resultados fracasos y el ultimo o 
A:-esimo resultado un exito. La probabilidad de que ocurra el primer exito en la k - 
esima prueba es igual a q p , luego: 

Definicion. Se dice que la variable aleatoria X que se define como el numero de 
repeticiones independientes de un ensayo de Bernoulli hasta que ocurra el 
primer exito, tiene distribution de probabilidad geometrica con parametro p y 
se escribe X ~ G(p) , si su funcion de probabilidad es 

f(x)=P[X =x] = q x 'p, jc = 1,2 etc. 

Para probar que la suma de las probabilidades geometricas es igual a 1 , se utiliza 
la suma infinita: 



TEOREMA 7.3. 

Si X es una variable aleatoria con distribution geometrica de parametro p , 
entonces, 



Q= {£, FE y FFE , .... }. 




, 1 

a) H = — , 

P 



L\ 2 

b) c = — 



P 



PRUEBA 
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OO 



00 



£(X) = £V"‘/> = p5><7*' I= P 




*=1 



Jt = l 



b) Ulilizando la identidad: ^ k 2 q k 1 =• — + ^ 

nr o-9) 



, se tiene: 







Luego. Pflr(X) = £(X 2 )-(£(X)) 2 = 2_£. ! 

P~ P 



1 



\-p _ q 



P~ P 



EJEMPLO 7.4 

Pruebe que si X tiene distribution geometrica con parametro p, enlonces. 
a )P[X>a) = q\ aeZ + , q = \- p 

b) P[X >k+sl X >k)=P[X >s). k,s&Z 

SOLUCION 

a) P[X >o] = l-P[X <a] = l -Y^'P = 1 - P = 9" 



EJEMPLO 7.5 

Un vendedor a domicilio hace llamadas telefonicas a clientes potenciales. La 
probabilidad de vender en cada Ilamada es 0.02. 

a) Calcule la probabilidad de que la sexta Ilamada sea su primera venta. 

b) Calcule el esperado del numero de llamadas hasta obtener su primera venta 

c) iQuc probabilidad hay de que su primera venta ocurra despues de mas de 5 
llamadas si ya se hizo 3 llamadas sin exito? 

d) El costo de cada Ilamada es S/.1.5. Si una Ilamada no es una venta la 
siguiente cuesta S/.0.5 mas. Halle el costo esperado del numero de llamadas 
que hace hasta que obtenga su primera venta 

SOLUCION. 

JSea X el numero de llamadas hasta conseguir una venta. Sus posjbles valores 
son: 1,23...., etc.. El modelo de probabilidad de X es geometrica de parametro 
p = 0.02 . esto es: 



b) P[X >k+s/X >k] = 



P[X >k+s] _ q k+> 



= q* =P[X>s\ 



P\X >*] 



PIX = k] = (0.02M0.98)* -1 , k = 1,2.3, 
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a) Luego, la probabilidad de que la sexta llamada sea su primera venta es: 
P[X =6] = (0.02)(0.98) 5 =0.018 



b) E(X ) = l/(0.02) = 50. A la larga en la llamada #50 obtiene su primera venta 

c) El evento “ya hizo 3 llamadas sin exito” es equivalente al evento “requiere hacer 

mas de 3 llamadas hasta que obtenga un exito”. Entonces, 



P[X > 3 a X >5] P[X>5] (0.98) 



— = (0.98) 2 



P[X >5/ X >3] = 

P[X> 3] F\X > 3] (0.98) 3 

d) Costo=1.5 + 2x(X -1), Costo esperado = 1.5 + 2x ((£(X)-1) = S/. 99.5 



7.1.4. Distribution de Pascal o binomial negativa 

Definicion. Se denomina experimento binomial negativo o de Pascal a las 
repeticiones independientes de un experimento aleatorio de Bernoulli hasta obtener 
el exito numero r. En cada ensayo de Bernoulli puede ocurrir un exito con 
probabilidad p o un fracaso con probabilidad q~\- p . 

A la variable aleatoria X que se define como el numero de intentos hasta que 
ocurra el exito numero r se le denomina variable aleatoria binomial negativa o de 
Pascal. Su rango es el conjunto: R x = {/\ r + 1, r + 2,... } 

Si k e Rx , el evento [X = k ] ocurre, si resulta exito en la &-esima prueba y en 
las restantes k - 1 pruebas resultan r - 1 exitos y (k - 1) - (r — 1) = k - r fracasos. 
Luego, la probabilidad de tener el r-esimo exito en la k-esima prueba es igual a: 



C k 1 r~l kr 1 t k 

r , } P V P = Cr-lP4 



Definicion. Si se repite en forma independiente un ensayo de Bernoulli, donde 
cada resultado puede ser un exito con probabilidad pun fracaso con probabilidad 
q-\—p , se dice que la variable aleatoria X que se define como el numero de 
intentos hasta que ocurran r exitos, tiene distribucion binomial negativa o de 
Pascal con parametros r y p y se escribe X - P(r t p ), si su funcion de probabilidad 
es: 

f(k) = P\Y = k] = £*“1 p r q k ' , k = r, r + 1, r + 2,..., etc. 



Para verificar que la suma de las probabilidades de Pascal es igual a uno, se usa 
la siguiente serie binomial negativa: 

1=0 k -1 
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NOTA. Sean X x , X 2 ,..., X T , r variables aleatorias mdependientes cada una con 
distribucion geometrica G(p), tales que. 

Xj es el numero de repeticiones necesarias hasta la ocurrencia del primer exito 

(£). 

X2 es el numero de repeticiones entre la primera ocurrencia de E hasta la 

segunda ocurrencia de E. 

... Etc. 

X r es el numero de repeticiones necesarias entre la r — 1 ocurrencia de E hasta 
la r-esima ocurrencia de E . 

Entonces, la variable aleatoria: 

*=2>. 

i = i 

es el numero de repeticiones mdependientes de un ensayo dc Bernoulli" hasta 
que se obtenga el exito numero r. Luego, X liene distribucion de Pascal con 
parametros r y p. 

TEOREMA 7.4 

Si X es una variable aleatoria con distribucion de Pascal con parametros r y /?, 
entonces, 

. 1 , . 2 Q 

a) p = r— , b) a = r— 



PRUEBA. 

Sean X, , X 2 ,..., X r t r variables aleatorias independientes cada una con 
distribucion geometrica, G{p), entonces, la variable aleatoria: 




X| 



tiene distribucion de Pascal con parametros r y p. Luego, 



V '= 



y 



i=i 



v(X)=v\ =x v (^,)=i;-T= 

i=i i=i p 



i=i 
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EJEMPLO 7.6 

Una maquina produce articulos de uno en uno y de manera independiente. Se 
considera que el 10% de ellos son defectuosos. Si la maquina se detiene apenas 
produce el cuarto articulo defectuoso: 

a) <Cual es el numero esperado de articulos producidos hasta que se detiene la 

maquina?. 

b) ^Cual es la probabilidad de que la maquina se detenga en el decimo artfculo 

producido?. 

c) ^Cual es la probabilidad de que produzca al menos 10 articulos para que la 

maquina se detenga?. 

SOLUCION 

Sea X el numero de articulos producidos hasta tener 4 defectuosos. La ley de 
probabilidad de X es Pascal con parametros r= 4 y p - 0. 1 . Esto es, 

P[Y = *] = C 3 *~V(1-P)*"\ k = 4,5, 6,..., etc. 

a) E(X) = r— = 4x — = 40 

p 0.1 

b) P[X=10] = C 3 V 4 (1-P) 6 

9 

c) P[X >10] = 1-/ J I4<X <9) = 1-^C*'V(1-/?)*- 4 . 

k-A 



7.1.5 Distribution hipergeometrica 

Definition. Un experimento hipergeometrito consiste en escoger al azar una 
muestra de tamano n , uno a uno sin restitution, de N elementos o resultados 
posibles, donde r de los cuales pueden clasificarse como exitos, y los N - r 
restantes como fracasos. 

En cada extraccion, la probabilidad de que el elemento sea un exito es diferente, 
ya que la extraccion es sin reposicion. 

Definition. Se denomina variable aleatoria hipergeometrica a la variable X que 
se define como el numero de exitos en el experimento hipergeometrico. 

Si n < r, el rango de X es el conjunto R x = {0,1,2,..., n) 

Sea k g R% y entonces, el evento [X = k] ocurre, si y solo si en las n extracciones 

sucesivas sin reposicion ocurren k Exitos y n - k fracasos. El total de formas que 
puede ocurrir es: 

c;v'v n N _- k r 
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Por otra parte, el numero de formas diferentes de escoger n elementos de TV una a 
una sin reposicion es igual a V ^ . 

Luego, la probabilidad de que ocurran k exitos en el expenmento 
hipergeometrico es: 



P[X=k] = - 



cyy 



N -r 



r N 



c:c N V 

k n - k 



Definition. Se dice que la variable aleatoria X que se define como el numero de 
exitos en una muestra de tamano n que se selecciona al azar uno por uno sin 
reposicion de TV elementos o resultados posibles, de los cuales r son clasificados 
como exitos y los restantes N — r como fracasos, tiene distribution 
hipergeometrica y se escribe X - //(TV, n, r), si su funcion de probabilidad es 



C r c N ~ r 

f(k) = P[X=k]=- k , k = 0,1,2,..., «. 

C N 



Para probar que la suma de las probabilidades es igual a 1 , se usa la identidad: 



Yc[c N ~: =c r+N ~ r 

jLu k n - k n 
Jt=0 




NOTA. En el numerador de la funcion de probabilidad hipergeometrica, se 
requiere que TV - r > n - k , de donde resulta, k > n + r - TV , luego, el menor 
valor que toma la variable aleatoria X es el numero: 

a = max(0, n + r - TV). 

Por otro lado, el mayor valor debe verificar k < n y k < r, luego, el mayor valor 
que toma X puede denotarse por: 

b - min(n, r). 



TEOREMA 7.5. 

Sea X una variable aleatoria con distribucion hipergeometrica //(TV, n, r), y 
sean, p = r/N t q-\- p , entonces, 

a) E(X) = np 

b) Var(X) = npq ^ ^ 
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c) H(N, n, r) = B(n, p ) Esto es, si N tiende a +oo o iVes grande con respecto 

a n , entonces la distribucion hipergeometrica H(N y n y r ) se aproxima a 
una distribucion binomial B(n,p). 

PRUEBA. 

Utilizando la identidad C N - — C N ~} , se tiene* 

" n n ~ ] 



« C r .C N ~ r 



a) E(X) = y y\k 'UL-DjlI = r .—. — - — .Y C? - 1 , C w “ r = «x— . 
S C* * C*"' £ N 



C‘ - k = 1 

n- 1 



r r - 1 

b) Se verifica E[X(X —\)] = n(n-\)x — x , entonces, 

N N - 1 

Var(X) = e(x 2 )- |a 2 = E{ X(X - 1)] + |i - [i 1 

Var(X) = n(n — l)x — x — — — + «. f/ix— 1 

N N- 1 N { NJ 

r r, .x r_i . nr i r r 

N[ N-l N J N l 

Var(X) = n*—x(l — — 

N { NJ {N - 1 ) 



(7 V-r)(7V-M) 
7V(/V-1) 



c) Aqui, TV tiende a +oo se interpreta como: M si N es grande con respecto a n". Si 
N es grande con respecto a n, entonces, se pueden hacer las siguientes 
aproximaciones: 



V N =N(N -l)(N -2)...(N -n + l)mN 



~ w" 



V' =r(r-l)(r-2)...(r-k^l) = r k 

V"_~ k r = (N—r){N — r + 1 )...(/V - r - « + * + 1) = ( /V - r) n ~ * 
Luego, si A es infinitamente grande con respecto a n , se tiene: 

y/c i 






cyy N r 

k k Ft - k 



rN 



^ r k (N-r) n - k 
C * 



N" 






La aprovfmaciQn es boena si n^Q.lxM . 
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Observe que la media de la binomial y la hipergeometrica es la misma, mientras 
que la varianza difiere en el factor de correccion (N - n)/(N - 1) , que se reduce a 
uno cuando N es grande respecto a n. 

EJEMPLO 7.7 

Se escriben los nombres de 7 mujeres y 3 hombres en pedacitos de papel y se 
los coloca en una caja. De la caja se escogen al azar 4 papelitos. 

a) Determine la distribution de probabilidad del numero de papelitos 
seleccionados que contengan nombres de hombres: 

al ) Si se escogen uno por uno sin reposicion 
a2) si se escogen uno por uno con reposicion 

b) Calcule la probabilidad de que se seleccionen los nombres de por lo menos 

dos hombres. 

SOLUCION. 

a) Sea X la variable aleatoria que se define como el numero de papelitos que 
contengan nombres de hombres de los 4 seleccionados: 

al) Si se escogen uno por uno sin reposicion, los valores posibles de X son: 
0,1, 2, 3- Entonces, X ~ H(\ 0,4,3) , y la funcion de probabilidades de X es: 

rV 7 

P[X =x) = - x *~ x , x = 0, 1, 2, 3 

C IO 
4 

a2) Si se escogen uno por uno con reposicion, los valores posibles de X son 
0,1,2, 3,4. Entonces, X~Z?(4,p), con p = 3/10 = 0.3 y la funcion de 
probabilidades de X es: 

P[X =x] = C 4 x p k (l-p) 4 ~ k , x = 0, 1, 2, 3, 4 



b) La probabilidad de que se seleccionen los nombres de por lo menos dos hombres 

P[X >2] = 1-P[0<X <1] 

Si se escogen uno por uno sin reposicion se tiene 

140 



CnCj + del 

P[ X > 2] = 1 - — — 1 3 = 1 - - 



-,10 



210 



= 0.333. 



£i se escogen uno por uno con reposicion se tiene: 

P[X >2]= = 1-[C^(0.3)°(0.7) 4 + C| 4 (0.3)' (0.7) 3 ] = 1-0.652=0.348 
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EJEMPLO 7.8 

Una compafua recibe semanalmente un embarque de 500 articulos de cierto 
tipo. La Cia. controla la calidad de cada embarque probando 10 articulos escogidos 
al azar uno por uno sin reposition y rechaza el embarque si mas de uno de los 
articulos probados no cumplen las especificaciones. Se sabe que cada embarque 
semanal contiene 90% de articulos que cumplen las especificaciones. 

Sea X el numero de articulos en la muestra que no cumplen las especificaciones. 

a) ^Con que probabilidad se rcchaza cualquier embarque semanal? 

b) Si el costo de la inspection semanal en soles esta dado por : C = 2 + 4X + A r2 
calcular el costo esperado por inspeccion 

c) Hallar la probabilidad de que el costo de inspeccion sea mayor o igual que 34 
soles. Resolver usando el modelo hipergeometrico y la aproximacion binomial 

SOLUCION. 

Los posibles valores de X son: 0,1, 2, ...,10 y su distribution es hipergeometrica 
H( 500,50,10), esto es: 

P[X =k]= CfC- k j C 5 0 °° , k = 0,1,...,10 

a) La probabilidad de rechazar cualquier embarque semanal es igual a: 

Pix > 2] = 1 - P[X < 1] = 1 - £ Cfc 4 ^ 0 , / C 5 0 °° = 1 - 0.7365 = 0.2635 
*=0 

b) £(C) = 2 + 4£(X) + £(A r2 )= 2 + 4x1 + 1.81 = 7.81 

donde E(X) = 10x— — = 1 , o 2 = 10x0.1 x0.9x^^ = 0.81 
500 500-1 

£(X 2 ) = o 2 +h 2 =0.81 + (1) 2 =1.81 

c) P[C > 34] = P[X > 4] = i _ p[ x < 3] = 1 - Cl°C^°_ k /c™ = 0.01 1 86 

*=0 

Aproximando la hipergeometrica H (500,50,1 0) a la binomial #(10,0.1), se 
tiene: 



10 

£[X>4] = £ 

x=4 



c 50 c . 4 „ 50 

x 10 - x 




10 

C*°(0. 1)'(0.9) ,0 “ * = 0.0128. 

jt=4 
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7.1.6 Distribution de Poisson 



Definicion. Se dice que la variable aleatoria discreta X , cuyos valores posibles son: 
0,1,2,..., tiene distribucion de Poisson con parametro X (X>0) y se escribe 
X~P(X), si su funcion de probabilidad es: 

f(x) = P[X=x] = jc = 0,1,2,... 

x\ 



Para verificar que la suma de las probabilidades de Poisson es igual a 1, se 

‘ a)* x 



utiliza la suma: 



En efecto, 



k\ 

Z e _W_ - e -*■ V 0)1 

k\ ^ b\ 



*= o 



: e e = e =1. 



*=o 



NOTA. La distribucion de Poisson se aplica a problemas donde la variable 
aleatoria es el numero de eventos independientes que ocurren en un intervalo de 
tiempo, o en una region plana (con un promedio dado), por ejemplo, entre otros: 

* Numero de Uamadas que recibe una central telefonica en el periodo de un 

minuto. 

* Numero de accidentes de trabajo que ocurren en una fabrica durante una 

semana. 

* Numero de fallas en la superficie de una ceramica rectangular. 

* Numero de bacterias en un volumen de un mt 3 de agua. 



TEOREMA 7.6 



Si X ~ P(X) y entonces, a) Media p. = X , b) Varianza: a 2 = X 
PRLEBA. 






jr-0 jt=l *' jt=l lf ’ 



e~ A (X) 



w , JT-1 



or 



\x-2 



b) E[ X (X - 1)] = V x(x - 1). g - (X)X = X 2 .c~ x ,Y = X 2 .e'\e x = X 2 

^ * “2 (jc-2)! 



jr=0 



JC! 



Como Var(X) = £'[A’(X-l)] + |i-|i 2 , 

entonces, a 2 = E[X(X - 1)] + n - |i 2 = X 2 + X - X 2 = X. 
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EJEMPLO 7.9. 

Suponga que llegan en forma aleatoria una serie de Ilamadas a una central 
telefonica con un pro medio de tres Ilamadas por minuto. 

a) Calcular la probabilidad de que en el periodo de un minuto 

al) no ocurra llamada alguna, a2) ocurran al menos 4 Ilamadas 

b) Si cada llamada cuesta S/.0.50, ^cuanto es el costo esperado por llamada? 

SOLUCION. 

Sea X el numero de Ilamadas que ocurren en el periodo de un minuto. 
X - P(X ) , donde X = 3 es el promedio del numero de Ilamadas por minuto. 
a) La probabilidad de que ocurran k Ilamadas en el periodo de un minuto es: 



P[X=k] = 






«~ 3 (3)* 

k\ 



k = 0,1,2,..., etc. 



al) La probabilidad de que no ocurra llamada alguna en el periodo de un minuto 
es: 



P[X=0] = 



g~ 3 (3)° 

0! 



0.0498. 



a2) La probabilidad de que ocurran al menos 4 Ilamadas en el periodo de un 
minuto es : 



3 

P[X > 4] = 1 - P\ X < 3] = 1 -]T — — = 1 _ 0.64723 = 0.35277. 

*=o kl 

b) Sea C el costo por llamada, entonces, C = 0.5 X , y 

E(C) = 0.5E( X) = 0.5x3 = 1.5 

NOTA. (Extension o redticcion del intervalo unitario) 

La probabilidad de que ocurran k eventos de Poisson en un intervalo de 
tiempo o en una region de tamano t es 

P[X = k]~ r~-~> k~0X2,...>etc 

k\ 

donde X es el numero promedio de ocurrencias por unidad de periodo o region (^t 
es el numero promedio de ocurrencias de eventos en el periodo o region de 
tamano r) 

t 
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EJEMPLO 7.10. 

Una empresa textil produce un tipo de tela en rollos de 100 metros. El numero 
de defectos que se encuentra al desenrollar la tela es una variable aleatoria de 
Poisson que tiene en promedio 4 defectos por cada 20 metros de tela. 

a) iQu6 probabilidad hay de que al desenrollar la tela se encuentre menos de tres 
defectos en los primeros 50 metros?. 

b) Hallar la probabilidad de que al desenrollar la tela no se encuentre defectos en el 
primer segmento de 5 metros de tela. 

c) Si se desenrollan 5 rollos de la tela escogidos al azar, ^cual la probabilidad de 
que no se encuentre defectos en el primer segmento de 5 metros de tela en al 
menos dos de ellos?. 

SOLUCION. 

Sea X el numero de defectos encontrados en un segmento de 20 metros de tela 
que ocurre con promedio X - 4 . La probabilidad de encontrar k defectos en el 
segmento de 20 xf metros de tela es: 



P[X=k] = 



*! 



k =0,1,2 >..,etc. 



donde Xt es el promedio de defectos en el segmento de 20 xt metros de tela, 

a) El promedio de defectos en los primeros 50 metros de tela es Xt = 4x2.5 = 10 
( / = 2.5 aumenta la longitud de 20 a 50 metros) y la probabilidad de que se 
encuentren menos de tres defectos en los primeros 50 metros de tela es: 



P[X <3] = P[X <2] = 



g~ lo (10)° 

0! 



e _,0 (10) 1 



<T lo (10) z 

2 ! 



0.00277 



b) El promedio de defectos en los primeros 5 metros de tela es Xt = 4(1/4) = ! 

( t - 1/4 reduce la longitud de 20 a 5) y la probabilidad de no encontrar defectos 
en los primeros 5 metros de tela es 

P[X = 0] = -- — = 0.3679 
0! 

c) Sea Y el numero de rollos que no tienen defectos en el primer segmento de 5 
metros de tela de 5 rollos de tela escogidos al azar La variable Y cuyos valores 
posibles son: 0, 1, 2, 3, 4, 5 se distribuye segun la ley binomial B(5 y p) y donde 
p = p[ x = 0] = 0.3679 . Luego, 

l 

P[Y > 2] = 1 - P[Y < 1] = 1 - £ Cl p k (1 - p) 5 ~ k = 1 - 0.3946 = 0.6054. 

*=0 
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Aproximacion de la distribution Binomial a la Poisson 



TEOREMA 7.7. Sea X una variable aleatoria con distribution binomial B{n.p) . 
Si cuando n —> +oo , p — ► 0 , y k = np , permanece constante, entonces, la 

distribution binomial se aproxima a la distribution de Poisson con parametro X. 



esto es ? 



P[x=x\=c n x p x (\-pY 



tiende a P[X = x] = 



-X-* Jt 

e X 



PRUEBA. 



x x\ 

Sustituyendo p = — , se tiene 
n 



PlX=x] = 



n(n - I)(h - 2)...(/? - x 



x\ 



(-} 


X 

1 


f 

1 




UJ 


1 


n 


n) 



P[X=x\~ 






Por otro lado, si cuando n — > +oc, np-k permanece constante, resulta 

, para i = l,2,3,...(x- 1) 



lim 

n —> +30' 



lim 1 

n — > +xv 



Hh 



lim 

/I — > +00' 



f.-±r-. 

>V n ) 



Luego. lim C n p x (1 - p) n 
n — > +oo A 



x! 



La aproximacion binomial a Poisson es aceptable si n > 30 y p < 0.05 . 



EJEMPLO 7.11. 

Un estudio realizado en las tierras de cultivo de Tarapoto concluye afirmando 
que la probabilidad de que cada hectarea de siembra de arroz contenga por lo menos 
un nido de hormiga es de 0.005. De 600 hectareas de siembras de arroz escogidas al 
azar, ^que probabilidad hay de que al menos 5 de eilas contengan por lo menos un 
nido de hormiga?. 
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SOLUCION. 

Sea X el numero hectareas, de las 600 de siembras de arroz escogidas, que 
contengan por lo menos un nido de hormiga. Los posibles valores de X son 
0,1,2,. ..,600 y se distribuyen segun el modelo binomial: 5(600,0.005) , esto es: 

P[X =k] = C* 00 (0.005)* (0.995) 600- * . k = 0, 1, 2,3 600 

La probabilidad de que al menos 5 de las hectareas de siembras de arroz 
contengan por lo menos un nido de hormiga es: 

4 

P[X > 5] = 1 - P[X S 4] = 1 ~ X C t°° (O' 005 )* (0-995) 600- * 

k=l) 

Si utilizamos la aproximacion a la Poisson, se tiene: X- np = 600(0.005) = 3 

cf°°(0.005)* (0.995) 600 = - (3) y 
k k\ 

4 3 k 

P[X >5] = 1-P[X <4] = 1-^^ — j— = 1-0.81526=0.18474 

k ' 



EJERCICIO. 

El numero de accidentes que sufre una empresa de Taxis se distribuye segun el 
modelo de Poisson con un promedio de 2 accidentes por semana. 

a) Si el primer dfa de la semana ya ha habido un accidente, ^cual es la probabilidad 
de que en esa semana no haya mas de dos accidentes? 

b) ^Cuantos autos tiene la Cia. de Taxis si existe una probabilidad igual a 0.25 de 
que no hay taxi que no sufra accidente en una semana? 



SOLUCION 

a) Sea X: # de accidentes que sufre la Cia. en el periodo de una semana. X tiene 
distribution de Poisson con promedio h=2 por semana. Luego, 

e~ 

P[\ < X <2] 



~~ 2 2 1 e 2 ! 2 



P[X < 21 X >11 = - 



P[X >1] 



1 ! 



2 ! 



= 0.626 



0! 



b) Sea Y : # de taxis que no sufren accidentes en una semana, de los n taxis que 
tiene la Cia. Y ~ B(n , p ) , donde p = P[X ~0] = e 2 



Se debe hallar n tal que, P[Y = 0] «= p"q n = 0.25 , entonces, (1 - e 2 ) n = 0.25 , 

de donde resulta n = ^5) _ 9 53 s 10 

log(l-^ 2 ) 
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EJERCICIOS 

Binomial 

1. Si X ~ B(n, p) ta* que E(X)= 3 y V(X) = 2A .calcular: X > 3] . 

Rp. n =15. p= 0.2. Prob=0.60I98. 

2. Un estudiante contesta al azar (o sea sin saber nada) a 9 preguntas, siendo cada 
una de 4 respuestas de las cuales solo una es la correcta. 

a) Determinar la distribucion de probabilidades del numero de preguntas 
contestadas correctamente. 

b) Si para aprobar tal examen debe contestar correctamente al menos 6 
preguntas, ^cual es la probabilidad de aprobar el examen?. 

Rp. a) B(9. 0.25). b)0.01. 

3. En una produccion, la probabilidad de que un objeto sea defectuoso es 0.2. Si en 
una muestra de n de tales objetos escogidos al azar uno por uno, se espera que 
haya un defectuoso, 

a) calcular la probabilidad de que haya un objeto defectuoso 

b) ^cuantos objetos defectuosos es mas probable que ocurra? 

Rp. a) n = 5, 0.4096, b) 1 



4 . El 75% de la mercaderfa que recibe un comerciante del fabricante A es de calidad 
excepcional, mientras que el 80% de la mercaderfa que recibe del fabricante B 
es de calidad excepcional. El 60% del total de la mercaderfa lo adquiere de A y 
el resto de B. Si se seleccionan 4 unidades de la mercaderfa, ^que probabilidad 
hay de que se encuentren 2 unidades que sean de calidad excepcional?. 

Rp. p= 0.77, X~B(4,ph P[X=2]=0.188 



5. En una empresa donde los empleados son 80% hombres y 20% mujeres estan 
aptos para jubilarse el 10% de las mujeres y el 10% de los hombres. De cinco 
solicitudes para jubilarse, ^cual es la probabilidad de que al menos dos esten 
aptos para jubilarse?. 

Rp. p=0.8x0. 1 +0.2x0. 1 =0. 1 . X ~ fl(5, 0. 1 ). P[X > 2]=0.08 1 5 . 

6. La produccion de cuatro maquinas es recogida en cajas de 5 unidades. La 
experiencia permitio establecer la siguiente distribucion de las cajas, segun el 
numero de unidades defectuosas que contienen; 



# de unidades defectuosas 


0 


1 


2 


3 


4 


5 


Porcentaje de cajas 


0.70 


0.15 


0.08 


0.05 


0.02 


0.00 



La inspeccion diaria consiste en examinar las 5 unidades de cada caja. 
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Se acepta una caja, cuando contiene menos de dos unidades defectuosas. En 
caso contrario se rechaza. 

a) i,Cual es la probabilidad de rechazar una caja que no contenga unidades 
defectuosas? 

b) <Cual es la probabilidad de aceptar una caja que contenga tres unidades 
defectuosas? 

Rp. Sea X :# unidades defectuosas en la caja, a) X ~ £( 5, 0.7), P[X>2]= 1-0.03 1=0.969, 

b) X~ £(5,0.05). £[X<1]=0.9774. 

7. Un vendedor a domicilio compra diariamente 10 unidades de un producto a $2 

cada una. Por cada producto gana 13$ si lo vende o pierde 1$ ademas del costo 
si no lo vende en el dia. Si la probabilidad de venta de cada unidad es 0.2 y si las 
ventas son independientes. 

a) hallar la distribution de probabilidad de las unidades vendidas. 

b) calcular la utilidad esperada del vendedor. 

Rp. aj £(10.0.2). b)S2. 

8. Una computadora utilizada por un sistema bancario de 24 horas asigna cada 
transaction al azar y con igual probabilidad, a una de cinco posiciones de 
memoria: 1, 2* 3, 4, 5. Si al terminar el periodo nocturno de un dfa se han 
registrado 15 transacciones, ^cual es la probabilidad de que el numero de 
transacciones efectuadas a las posiciones de memoria par sea mayor que 3? 

Rp. Sea X:# de exitos de 15, exito=transacc. pares, P(exito)=2/5. X~£( 15.0.4), £[X>3]=0.909. 

9. Una secretaria que debe llegar a la oficina a las 8 de la manana, se retrasa 15 
minutos en el 20 % de las veces. El gerente de la companfa que no llega si no 
hasta las 10 de la manana llama ocasionalmente a la oficina entre las 8 y 8.15 
de la manana para dictar una carta. Calcular la probabilidad de que en 5 
mananas por lo menos en una no encuentre a la secretaria. 

Rp. Exito=No esta de Sam a 8 15am. X. # de exitos de n- 5, X~£(5.0.2), £[X>1 ]=0.C72. 

10. Al realizar un experimento, la probabilidad de lograr el objetivo es 0.4. Si se 
realiza el experimento 20 veces bajo las mismas condiciones y asumiendo 
resultados independientes 

a) Calcular la probabilidad de lograr el objetivo por lo menos en tres de las 20 
veces 

b) El costo de realizar el experimento es de S/.1500, si se logra el objetivo; y 
de S/.3000 si no se logra. Calcular el costo esperado para realizar el 
experimento. 

Rp. X # exitos de n= 20. exito=4ograr el objetivo, p=0.4. X~£(20,0.4), £(X)=8 a) P[X>3]=0.996. 

b) costo=l 500X+3000(20-X), £(costo)=48000. 
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11 . Una prueba de aptitud consta de 10 preguntas con cinco alternativas cada una, 
de las cuales solo una es la correcta. La calificacion se realiza de la siguiente 
manera: Cada pregunta correctamente contestada vale 2 puntos. Por cada 
pregunta mal contestada se descuenta k puntos. 

a) Determine el valor de k de tal manera que la nota esperada de un alumno 
que respojide al azar las 10 preguntas sea cero. 

b) ^Cual es la probabilidad de que un alumno que responde al azar las 10 
preguntas , tenga una nota mayor o igual all?. 

Rp. a) X : #dc respuestas correctas, X-fi(10. 0.2). £(X)= 2, Nota=2X-A:(10-X) . 

a) £(Noia)=0, implica *=0.5, b) P[Nota>l 1]=P[X>7]=0. 

12 . Una agencia de viajes observa que el 20% de las reservas de pasajes para 
viajar al interior no se hacen efectivas. Si la compama decide acepar reservas 
por un 20% mas de los 15 cupos que posee, calcular cl porcentaje de clientes 
que habiendo hechos sus reservas se quedarian sin viajar. 

Rp. X : # de cupos cubiertos de 18 X~Z?(18, 0.80), P[X>15]=0.271 . 

13 . El tiempo de duracion X , en meses, de un tipo de resistencia electiica tiene 
funcion de densidad de probabilidad: 

.. , [o.5e~° 5 *, si xZO 

f(x) = \ 

[0, en otro caso 

a) ^Cual es la probabilidad de que una de tales resistencias electricas dure mas 
de 4 meses?. 

b) Si se prueban 10 resistencias electricas, /.cual es la probabilidad de que 
ninguna dure mas de 4 meses?. 

c) ^Cuantas resistencias se probarian para que con probabilidad igual a 0.9 se 
tenga al menos uno que dure mas de 4 meses? 

d) Si el costo de produccion de una resistencia es: 

C=2 + (30-X) 2 

^cudnto es el valor esperado del costo? 

Rp. a) p=P[X> 4]=e 2 =0.135, b) L-fi(10./?), Pf ^0H0.865)'°, c) W~B(n,p\ 0.9=P[VV^1], 
implica, (0.865)M).l, entonces, n=15.877s!6, d) £"(0=790. 



Geometrica y Pascal 

14 . En cierto proceso de produccion se sabe que el porcentaje de artfculos 
defectuosos es de 0.02. Se controlan la calidad de los artfculos uno por uno 

a) Calcular la probabilidad de que el decimo articulo probado sea el primer 
defectuoso encontrado. 

b) En promedio, ^cuantos artfculos se probanan hasta encontrar el primer 

defectuoso? Rp. a) 0.017, b) 1/0.02= 50. 
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15. Cierto virus ha invadido un coiegio atacando al 5% de los ninos. Si tales ninos 
son examinados uno por uno, ^cual es la probabilidad de que el doceavo nino 
examinado sea el quinto nino encontrado atacado por el virus?. 

Rp. C^(0 05) 5 (0.95) 7 . 

16. Un vendedor a domicilio estima en 0.3 la probabilidad de efectuar una venta. 
Suponga ventas independientes. 

a) En promedio, ^cuantas visitas domiciliarias debe efectuar hasta tener 12 
ventas?. 

b) ^Cual es la probabilidad de que se hagan al menos 10 visitas para tener 4 
ventas?. 

Rp. a) 40, b) 

17. En un proceso de produccion, la probabilidad de que se produzca cada artieulo 
que cumpla ciertas especificaciones es 0.99. En determinado momento se 
plantea el objetivo de producir 150 artfculos que cumplan con las 
especificaciones; pero al mismo tiempo se decide detener el proceso de 
produccion tan luego se produzca el primer artieulo que no cumpla con las 
especificaciones. 

a) ^Cual es la probabilidad de lograr el objetivo?. 

b) Si despues de producir 100 artfculos aun no se ha detenido el proceso, ^.cual 
serfa la probabilidad de lograr el objetivo?. 

Rp. X: # de artfculos producidos hasta que ocurra ler defectuoso. X~G(0.0l ) , *=1.2. etc.. 

a) P[X> 150]=(0.99) 150 , b) P[X> 150/X>100]=(0.99) 5 ° 

18. Una compania petrolera ha sido designada para perforar pozos en la amazonfa 
peruana hasta obtener un resultado exitoso. La Compania estima en 0.7 la 
probabilidad de no hallar petroleo para cada pozo que perfora. 

a) Suponga que la compania petrolera cree que una sene de exploraciones sera 
rentable si el numero de pozos perforados hasta que ocurra el primer exito 
es menor o igual que 5. Calcule la probabilidad de que la exploracion no 
sera rentable si ya fueron perforados 3 pozos y en ninguno de ell os se 
encontro petroleo. 

b) El costo para perforar cada pozo es de $10,000. Si un ensayo no resulta 
exitoso, el siguiente ensayo tiene un costo adicional de $5000. ^.Cuanto es 
el costo esperado del proyecto? 

c) Si la compania dispone de un presupuesto de $145,000, ^cual es la 
probabilidad de que los trabajos experimentales tengan un costo que 
sobrepase el presupuesto de la compania?. 

Rp. X = # de perforaciones hasta obtener exito. X~G(/?), p- 0.3. a)f ) [X>5/X>3L/ 3 [X>2J=(().7)‘ . 
b) C(X) = 15,OOOX - 5.000. E(C(X)) = $45,000. c)P[C(X)>l 45.000] =P[X> 10] =<0.7) ,n 
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19 . Un experimento se repite de manera independiente hasta que se obtiene el 
primer exito. El costo C producido, esta en funcion del numero X de 
repeticiones necesarias hasta tener exito y es dado por: 

C = 200 + 5X + 4X 2 

Se sabe que la varianza del numero de repeticiones necesarias hasta obtener 
exito es 40/36. Si en estas condiciones. el experimento debe ser realizado por 
200 personas hasta que cada una de ellas obtenga exito, ^cuanto serfa el costo 
esperado?. 

Rp. E(Q=200+5£(X)+4£(X 2 >=221 .2, de Var(X)=40/36-( I pVp\ resulta p= 0.6, £(*)= 1/0.6, 

V(X)=[40/36+{ 1 0/6 ) 2 ] , 200£(C>200x221 .2=42,443.8. 

20. En un lote de 15 artfculos existen n que son defectuosos. Se extraen uno por uno 
con restitucion hasta obtener el primer defectuoso. El costo total por inspeccion 
es 2 X donde X es el numero de artfculos inspeccionados. Hallar n si el costo 
total esperado por inspeccion es $16. 

Rp. X~ G(p), con p~n/\5. De 16=£(2 x )=2/>/(2p-l). sale p=8/l5, y n = 8. 

OO 

Z l 1 1 

kq = 

*=. a-9) 2 

® k 1 

Rp. Derive respecio a q ambos lados de X = • 

JU 0 1 - q 

Hipergeometrica 

22 . Una caja contiene 20 chips, de los cuales el 20% no estan aptos para su venta y 
el resto si. Se escogen 5 chips a! azar uno a uno sin reposicion. 
a) Determine la distnbucion de probabilidad del numero de chips escogidos que 
sean no aptos para su venta. 

b) Calcular la probabilidad de que al menos uno sea no apto para su venta. 

Rp. a) P[X=k]= C;C' 6 JCf .*=01,2.3,4 , b) / > [X>1]=1-/ J [X=0]=1- (C^/C, 20 ). 



23. Un determinado producto industrial es embarcado en lotes de 20 unidades. Se 
escogen 5 items al azar de un lote y se rechaza el lote si se encuentra dos o mas 
defectuosos; en caso contrario se acepta el lote. Calcular la probabilidad de 
aceptar un lote que tiene 3 defectuosos si los items se escogen uno por uno, 

a) con reposicion, b) sin reposicion. 

Rp. a) X~£( 5. 0.15). P[X< 1 1=0.8352. b) X~H( 20.3,5), £[*< 1]=0.8596. 

24. Una ensambladora de computadoras recibe lotes de 10 taijetas cada uno de un 
tipo especffico, en la proporcion, 30% de marca A v 70% de marca B. Se sabe 
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que el porcentaje de produccion defectuosa es de 40% para la marca A y de 10% 
para la marca B. Si se prueban 3 tarjetas extraidas al azar una a una y sin 
reposicion de un lole elegido al azar, calcular la probabilidad de no encontrar 
tarjetas defectuosas. 



Rp. 



JL£o£l 

10 cf 



, 7 clfil 

10 cf 



= 0.54. 



25. Un jurado de 9 jueces va a decidir la inocencia o culpabilidad de un reo. 
Suponga que 6 votan por la inocencia y el resto por la culpabilidad. Si se 
seleccionan al azar 3 jueces y se pregunta por su voto , 

a) Calcular la media y la varianza del numero de jueces de la seleccion que 
votan por la inocencia. 

b) ^Cual es la probabilidad de que ningun juez seleccionado este a favor de la 
inocencia del reo?. 

Rp. a) p=3(6/9)=2, g 2 =0.5, b) 0.01 19. 



26. Un lote grande de N sacos de cafe de un quintal contiene 10% de sacos con 
impurezas. Del lote se cargan a un camion 20 sacos escogidos al azar. 

a) Determine la distribucion de probabilidad del numero de sacos de cafe con 
impurezas escogidos, ^cuantos sacos de cafe con impurezas se espera cargar 
al camion si se cargan muchas veces?. 

b) Si N =1,000, calcular aproximadamente la probabilidad de que se haya 
obtenido a lo mas 6 sacos con impurezas. 

Rp. a) H(N . 0.I/V, 20), Esperado=2, b) Aprox a la binomial. Profr= 0.9976. 

27. Una compama recibe un envfo de 20 piezas de un proceso de manufactura. El 
control de calidad de la Cfa. consiste en tomar una muestra de 3 piezas al azar 
sin reposicion de este envfo. Si en la muestra se encuentra al menos una 
defectuosa, se rechaza el lote; en caso contrario se eligen al azar 2 piezas 
adicionales. Si en la segunda muestra se encuentra al menos una defectuosa, se 
rechaza el lote; en caso contrario se acepta el lote. Calcular la probabilidad de 
rechazar el envfo si contiene 25% de piezas defectuosas. 

Rp. 0.8. 

28. En una fabrica la produccion semanal de cierto tipo de artfculo es de 1000 
unidades. Cada semana se realiza un control de calidad seleccionando una 
muestra de 20 unidades del artfculo, escogidos al azar y sin reposicion de la 
produccion de la semana (1000 artfculos) y adoptando la siguiente regia de 
decision: aceptar que el porcentaje de produccion defectuosa es 2% si en la 
muestra se encuentra a lo mas un defectuoso, o rechazar que el porcentaje de 
produccion defectuosa es 2% en caso contrario, ^cual es la probabilidad de que 
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se haya decidido aceptar que el porcentaje de produccion defectuosa de una 
semana es IVc cuando en realidad fue 5^ de los 1000 producidos? 

Rp. X:# defect en muestra de «=20. X~//(1000, 50.20), 
P[ aceptar] =P[ X< 1 /p=0 . 05 ] = (C£°C^° + C^C^J/C^g 00 



Poisson 

29. El numero medio de automoviles que llegan a una garita de peaje es de 120 por 

hora 

a) Calcular la probabmdad de que en un minuto cualquiera no llegue automovil 
alguno. 

b) Calcular la probabilidad de que en el periodo de 3 minutos lleguen mas de 5 
automoviles. 

c) Si tal garita puede atender a un maximo de 3 automoviles en 30 segundos, 
calcular la probabilidad de que en un medio minuto dado lleguen mas 
automoviles de lo que puede atender. 

Rp a) k= 2, e 2 =0. 135. b) ki= 6. P[X>5]=0.554. c) kt= 1 . P[X>3}= 0.01 89.. 

30. Un lfquido contiene cierta bacteria con un promedio de 3 bacterias por cm 3 ., 

calcular la probabilidad de que una muestra. 

a) de 1/3 de cm 3 , no contenga bacteria alguna. 

b) de 2 cm 3 , contenga por lo menos una bacteria. 

Rp. A=3, a) X/ = 1. prob=0.368, b) kt- 6, proh=0.998. 



31. Suponga que el numero de accidentes de trabajo que se producen por semana en 

una fabrica sigue la ley de Poisson de manera que la probabilidad de que 
ocurran 2 accidentes es igual a 3/2 de la probabilidad de que ocurra un 
accidente. Calcular la probabilidad de que no ocurran accidentes en 2 semanas 
consecutivas. Rp. X= 3. 0.002. 

32. Un banco atiende todos los dias de 8am. a 4pm. y se sabe que el numero de 
clientes por dia que van a solicitar un prestamo por mas de $10,000 tiene una 
distribution de Poisson con una media de 3 clientes por dfa. 

a) ^Cual es la probabilidad de que hasta el mediodia no se haya producido una 
solicitud de prestamo por mas de $10,000? 

b) En cuatro dias, ^cual es la probabilidad de que en dos de los dfas hasta el 
mediodia no se haya producido una solicitud de prestamo por mas de 
$ 10 , 000 ? 

Rp. X=3. a) kx= 1 5 P[X=0)=e- , 5 =0.223. b) C? (0.223) 2 (0.777) 2 



33. La demanda semanal de cierto producto tiene una distribuci6n de Poisson. 
Actual mente su media es 3 por semana. Se estima que despues de una campana 
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publicitaria, el valor esperado de la demanda se duplicara con probabilidad 0.8 > 
se triplicara con probabilidad 0.2. ^cual es la probabilidad de que despues de la 
campana la demanda sea igual a 4?. 

Rp. / > (demanda=4 despues de la campana)=U.8e' 6 (6) 4 /4!+ U.2e v (9) J /9' 

34. El numero de personas que cada dia se aloja en un hotel es una variable 
aleatoria X que liene distribucion de Poisson con parametro X, que puede ser: 

igual a 20 con probabilidad 0.5, 
igual a 15 con probabilidad 0.3, 
igual a 10 con probabilidad 0.2 

a) Determinar P[X-k] , donde k =1,2, . .., etc.. 

b) Calcular el valor esperado de X. 

Rp. a) P[X=k]= 0.5 P[X=kfo= 20] +0.3 P[X=/:/*=15]+ 0.2 P[X=*A=10], 
b) £(X)=0.5x20+0.3x 15+0.2x1 0=1 6.5 . 

35. Cierto tipo de loceta puede tener un numero X de puntos defectuosos que sigue 
una distribucion de Poisson con una media de 3 puntos defectuosos por loceta. 
El precio de la loceta es $1 si X = 0, de $0.70 si X=1 o 2. y de $0.1 si X>2. 
Calcular el precio esperado por loceta. 

Rp. X=0, prob=0.04979, X=1 o 2, prob=0,3734. X>2, prob=0.57681. esperado=S0.37 



36.. El numero de usuarios que acuden a cierta base de datos confidencial sigue una 
distribucion de Poisson con una media de dos usuanos por hora. 

a) Calcular la probabilidad de que entre las 8 am. y el mediodia ( 12.m) acudan 
mas de dos usuarios. 

b) Si un operador de la base de datos trabaja todos los dias de 8 am. hasta el 
mediodia (12.m), ^cual es la probabilidad de que este operador tenga que 
esperar mas de 7 dias hasta observar el primer dfa en el cual acceden mas 
de dos usuarios?. 

Rp. a) X: Poisson con Ai= 8. P[X>2]=0.986. b)Y~G{ph donde p- 0.986 />[K>7.]=r(XOI4i 

37. Cierta panaderia dispone de una masa con frutas confitadas para hacer 200 
panetones. Agrega 2,000 pasas de uvas a la masa y la mezcla bien. Suponga 
que el numero de pasas es una variable aleatoria de Poisson con un proinedio 10 
pasas por paneton. 

a) Calcular la probabilidad de que un paneton elegido al azar no contenga 
ninguna pasa. 

b) ^Cuantos panetones se espera que contengan 6 pasas? 

c) Suponga que en tal production hay 15 panetones con a lo mas 6 pasas, si un 
cliente adquiere 5 panetones, ^cual es la probabilidad de que dos tengan mas 
de 6 pasas?. 

Rp.a)<T l °, b) 200xP[X=6]=200x0. 108=21. 62=22, jc} m . 
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38 . Una companfa de seguros encuentra que el 0.1% de los habitantes de una 
gran ciudad fallece cada ano en accidentes de transito. Calcular la probabilidad 
que la companfa tenga que pagar en un ano a mas de 10 de sus 3,000 
asegurados contra tales accidentes. 

10 k 

Rp. HX>10]=1- I =1-0 99971=0.00029. donde p=3000x0.001=3 

k=0 

39 . Suponga que la probabilidad de que se haga una soldadura defectuosa en un 
conexion dada es 0.001 . Calcular la probabilidad de que se presenten a lo mas 2 
defectos en un sistema que tiene 5,000 conexiones soldadas 
independientemente. 

Rp. X ~ 5(5000,0.001) se aproxima a P(X) con X=5000x0.001-5, 5[X<2]=0.125 

40 . Un libro de n paginas contiene en promedio X errores de impresion por pagina 
Calcular la probabilidad que por lo menos una pagina contenga por lo menos 
k + 1 errores. 

Rp. Sea X: # de errores por pagina, X~P{\). Sea Y :# de paginas con por lo menos k + 1 errores. 

Y~B(n t p\ p-P[X > /c+1] es la probabilidad de k+ 1 errores por p&gina. La probabilidad que por 
lo menos una pagina conienga por lo menos k+I errores es / 3 [>^l]=l-/ 5 [^-0] 
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7.2 ALGUNAS DISTRIBUCIONES IMPORTANTES 
DE VARIABLES ALEATORIAS CONTINUAS 



7.2.1 Distribution uniforme 



Definition. Se dice que la variable aleatoria continua, X, tiene distribucion 
uniforme (o rectangular) en el intervale [ a , b] 9 a <b , y se describe por 
X ~ U [a 9 b], si su funcion de densidad de probabilidad es 



/(*) = « 



1 

b-a ’ 

0 , 



si a<x<b 
en otros casos 



La funcion de distribucion del modelo uniforme es: 



0, si x < a 



F(x) = 



x — a 
b — a 
1 , 



si a<x<b 
si x > b 



La grafica de la funcion de densidad y de la distribucion acumulada se dan en la 
figura 7.1. 





Figura 7.1 Funcidn de densidad y de distribucidn acumulada uni forme 

NOTA. Si [c, d] c: [a,b ] , la probabilidad de que X tome valores en el intervalo 
[c\ d\ es: 

d — c 

P[c<X = 

b-a 
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Esta probabilidad solo depende de la longitud del intervalo [c, d\ y no de su 
ubicacion dentro del intervalo [a, b] % y es la misma para todos los intervalos que 
tengan la mima longitud: d -c . 

Algunas variables aleatorias conti nuas tienen distribucion uniforme, por 
ejemplo: 

- las coordenadas de un punto que se elige al azar en un intervalo dado. 

- los instantes aleatorios en un periodo de tiempo dado. 

- etc 

TEOREMA 7.8. 

Si la variable aleatoria X tiene distribucion uniforme en el intervalo [a,b\, 
entonces, 

. ey v \ a+b , , , v , ( b-a ) 2 

a) E(X) b) Var(X ) = 

2 12 



EJEMPLO 7.12 

Dos gerentes A y B deben encontrarse en cierto lugar entre las 7 p.m. y 8 p.m. 
para firmar un contrato. Cada uno espera al otro a Io mas 10 minutos, ^cual es la 
probabilidad de que no se encuentren sabiendo que A llega a las 7.30 p.m.?. 

SOLUCION. 

Sea la variable aleatoria X el tiempo de llegada de B, que puede hacerlo en 
cualquier instante aleatorio entre las 7 p.m. y las 8 p.m. o entre 0 y 60 minutos. 
Entonces, X ~ £/[0,60] y su funcion de densidad de probabilidad es: 



/(*) = « 



J_ 

60 * 

0 , 



si 0 < x < 60 
en otros casos 



Puesto que A llega a las 7 30 p.m. o a los 30 minutos despues de las 7 p.m. y 
espera a lo m£s 10 minutos, B no se encontrara con A si B llega de 7 p.m. a 
menos de 7.20 p.m. o si llega de despues de las 7.40 p.m.. Luego, la probabilidad 
de que A y B no se encuentres es 



P[0<X <20 o 40< X < 




f 60 1 , 20 20 

| — dx = — + — 
J40 60 60 60 



2 

3 



EJEMPLO 7.13 

Un vendedor cobra honorarios fijos de S/.200 mas una comision de 5% del total 
de las ventas que realiza. Si el total de las ventas que realiza es una variable 
aleatoria X con distribucion uniforme entre 0 y 2000 soles, 
a) ^Cuanto es la utilidad promedio del vendedor? 
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b) t,Que probabilidad hay de que obtenga honorarios superiores a S/.275?. 
^Cuanto debe vender como mini mo?. 

c) Si vende como minimo S/.500, iqu6 probabilidad hay de que gane mas de 



d) Se le propone al vendedor como honorarios el 32% de las ventas que 
reaiiza. Si quiere ganar por lo menos S/.240, <.le conviene? 

e) <,Cual es la probabilidad de que obtenga una ganancia igual a S/.250 ? 

SOLUCION. 

La utilidad o ganancia del vendedor es: U = 200 + 0.05 X ,donde, X ~ (J[ 0. 2000] 

a) E(U ) = 200 + 0.05 *E(X)= 200 + 0.05x1000 = 250 



d) P[0.32X > 240] = P[X > 750] = 1 250/2000, pero, 

P[200 + 0.05 X > 240] = P\X > 800] = 1200/ 2000 . Si le conviene. 

e) P[U = 250] = P[X = 1000] = 0 

7.2.2 La distribution normal 

Definicion. Se dice que la variable aleatoria continua, X, que toma los valores 
reales, -oo <*<+<*>, se distribuyc norinalmente (o mas brevemente es normal) 

con parametros p y o y se describe por X ~ /V(p,a") t si su funcion de densidad 
es: 



S/.260?. 



500 

b) P[U >275]= P[X >1500] = - = 0.25. Debe vender minimo S/. 1500 



2000 



800 

c) P[U > 260/X > 500] = P[X >1 200 / X > 500] = = 8/15 

1500 




—oo < .v < oc . 



donde -oo < p < oo, a > 0 . Su grafica es la figura 7.2. 



f(x) 



0 




X 



Fig. 7.2 Grafica de la funcion de densidad normal 
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La distribution normal es el modeio probabilistic^ que se usa mas 
frecuentemente y sirve como una buena aproximacion de muchas distribuciones 
que tienen aplicaciones importantes. 



NOTA. Aceptamos, sin verificar, que 




Luego, si se hace z = (x - p)/a , se tiene -oo < z < +oo , dx- adz , y 




.~l 2 / 2 A, - 



dz = 1. 



7.2.2. 1 Propiedades de la distribution normal 



A partir de su grafica y del analisis de su funcion de densidad, la curva normal 
tiene las siguientes propiedades: 

1 . Es simetrica con respecto al eje vertical X = p , ya que f(x ) solo depende de x 
mediante la expresion (x - p) 2 , luego, 

/(p + *) = /(p-x) 

2. Tiene valor mdximo en x = \jl (su moda). Este valor maximo es: 



3. Tiene al eje X como una asintota horizontal , ya que 

lim /(jc) = 0 y lim /(jc) = 0. 

X— X— 

4. Tiene puntos de inflexion en jc = p - cr, y x : = p + a . por tanto. es cdncava 
hacia abajo en el intervalo p~a<^:<p + a, y concava hacia arriba en 
cualquier otra parte. 

5. El area total que encierra la curva y el eje X es igual a 1 
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TEOREMA 7.9. 

Si la variable aleatoria X tiene distribucion normal /V(p,cr 2 ) , entonces, 
a )E(X) = n, b) Var(X) = G 2 . 

PRUEBA. 

a) Em- -L. fV^L 

•'“ co 

Haciendo, z-(x- 1 jl)/o , resulta -oo <z< +oc , y dx = adz , luego. 




La primera integral es igual a cero, por integracion directa o por el hecho de 

2 12 

que el integrando h(z ) = ze 1 es una funcion impar, esto es, satisface la 
relacion h(z) = -h(~z) y en consecuencia su integral es igual a cero. La 
segunda integral es igual a 1 . Luego, E(X ) = p . 

if*#* 

b) Eflr(X) = E[(X-M ) 2 ]=— l — P(jt-|i) 2 e ^ ° ' dx 

o\2n 

Haciendo, z = (x - \jl)/g , resulta -00 < z < +oc , y dx = odz , luego, 

e[(x -ix) 2 ]=^L r z 2 e-* 2/2 dz 

V27i j ~ co 

Ademassiw = z y dv = ze’ z ^ 2 ,se obtiene v = -e~ z ^ 2 , y 

e[(X - n) 2 ]= -2L [- ] + “+ a 2 = 0 + a 2 (1) 

V27T <» J-co ^2/r 

Luego, Vlar( X ) = a 2 
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7. 2.2.2 Distribucion normal estandar y uso de la tabla 
normal 

Si la variable aleatoria X tiene distribucion normal ct 2 ) , entonces, la 

variable aleatoria estandar Z = (X - p)/o\ tiene distribucion normal N( 0,1) . 

En efecto, la variable estandar Z tiene media igual a cero y varianza igual a 
uno, esto es, 

E(Z) = 0 y Var(Z) = 1 

Ademas, la probabilidad: 




Si X toma el valor x , entonces, el correspondiente valor dc Z es z — (x - p)/o . 
Si X toma el valor x } , entonces, el correspondiente valor de Z es z, = (*] - p)/a . 
Tambien — oo <z< +°° , y dx = adz , luego, 

P[X <*,]= r — j=e 2 ( ° ) *= p ~^=e~ z ^ 2 dz = P[Z <Z,]. 

J- 00 aV27i yj2n 

La funcion de densidad y la funcion de distribucidn acumulada de la normal 
estandar son respectivamente: 

<K z) = -f=e~ r t 2 , y, <D(z) = f —==e~‘l 2 dt 

v271 j -°° V 2ll 

La grafica de <D(z) es la parte sombreada de la figura 7.3. 




Fig. 73 Disiribucidn normal estandar 
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Tabulacion de la distribution normal 

La probabilidad: 

P[a<Z<b]= I* —p=e~ l ^ 2 dz 
ia -Jin 

no puede calcularse por metodos de integracion directa, puesto que no se puede 

-z 2 /2 

encontrar una funcion cuya derivada sea igual a e ' . Pero, usando metodos de 
integracion numerica se han tabulado los valores de la funcion de distribucion 
acumulada de la normal estandar : 



<t(z)=/ > [z^z]= r ¥odt= r -3= *-' 2,2 dt. 

Jc0 V 2tz 

Las areas <D(z) que se representan en la parte sombreada de la figura 7.3, 
tienen las siguientes propiedades: 

1) P[a<Z<b] = <D{b)-<D(a). 



2) O(-z) = 1 - O(z) , esto es, es simetrica respecto a la vertical Z = 0 . 

3) P[-a <Z<a] = O(fl) - <£(-«) = O(a) - (l - 0 (a))= 20(a) - 1 . 

4) Si la variable aleatoria X tiene distribucion /V(p,a 2 ), entonces, la variable 
aleatoria Z = (X - p)/o tiene distribucion N( 0,1 ), luego, 



P[a < X < b\ = < Z < ^ j • 4/*^ j -4^} 



En la tabla de probabilidades normal estandar se puede encontrar la probabilidad 
1 - a , o el valor z,_ a de Z mediante la relacion: 



P[Z <Zi_ a ] = l-ot o <&( Z] _ a ) = \-a 
como se indica en la figura 7.4. 




Fig. 7.4 Areas de la distribucidn normal est&ndar 
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EJEMPLO 7.14. 

Utilizando la tabla de probabilidades normal hallar 

a) P[Z <1.2], b) P[0.81 < Z <1.94] , c) P[Z<-1.28], 

d) P[-0.46 < Z < 2.21] , e) P[Z > -0.68] , 

f) P[-2.04 < Z < -1 .98] , g) P[Z < 1 .6761 ■ 

SOLUCION. 



a) 0(1 .20) = 0.8849. 

b) 0(1 .94) - 0(0.8 1) = 0.9738 - 0.791 0 = 0. 1 828 . 

c) 0(- 1 .28) = 1 - 0(1 .28) = 1 - 0.8997 = 0. 1 003 . 

d) 0(2.2 1) - O(-0.46) = 0(2.2 1) + 0(0.46) - 1 = 0.9864 + 0.6772 - 1 = 0.6636 . 



e) P\Z > -0.68] = P[Z < 0.68] = 0(0.68) = 0.75 17 . 

0 0(2.04) - 0(1 .98) = 0.9793 - 0.9761 = 0.0032 

g) Un procedimiento es aproximar z a dos decimales, en este caso, 

P[Z < 1 .676] = P[Z<\ .68] = 0.9535 . 

Si se requiere de mayor precision, se puede usar el siguiente proceso de 
aproximacion por interpolation lineal (ya que se interpola en el tercer decimal y 
por tanto el pedazo de curva es suavizada por un segmento de longitud muy 
pequena): 

valores de Z: 1 67 < 1 .676 < 1 .68 

areas respectivas: 0.9525 < 0(1 .676) < 0.9535 



Luego, 



0(1.676) -0.9525 
0.9535 - 0.9525 



1 676 -!ff , resultando 0(1.676) = 0.9531 . 
1.68-1.67 



EJEMPLO 7.15. 

Utilizando la tabla de probabilidades normal, hallar el valor de z tal que: 
a) P[Z < z] = 0.8621 , b) P[Z <z] = 0.2236 , 

c) P[-z < Z < z] = 0.9500 d) P[-z < Z < z] = 0.9900 , 

e) P[-z<Z<z) = 0.9000. 

SOLUCION. 
a) z = 1 .09 
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b) z = -0.76 

c) z = ±1.96 

d) P[-z <Z <z\ = 20(z) - 1 = 0.9900 , entonces, O(z) = 0.9950 



Por interpolation se tiene: 



valores de Z: 2.57 <z< 2.58 

areas respectivas: 0.9949 < 0.9950 < 0.995 1 

- z - 2.57 0.9950-0.9949 

Entonces, = , 

2.58-2.57 0.9951-0.9949 



resultando z = 2.575 . 



e) Analogamente z = 1.645. 



EJEMPLO 7.16. 

Si X tiene distribution A(p, a 2 ) , 

a) Verificar que el area comprendida 

al) Entre p-ay p + a es 68.26%. 
a2) Entre p - 2a y p + 2a es 95.44%. 
a3) Entre p - 3a y p + 3a es 99.74%. 

b) Calcular el valor de k tal que: 

P[p - ka<X < p + to] - 0.5000. 



SOLUCION. 



a) P[ii-ka<X <\i+ko] 






X-Vi 



<k 



= P[-k <Z <k] = 2®(k)-l 



Luego, <p + fcc] = 20(A:)-l . 



En particular, se tiene: 

al) />[p-CT<X <p + c] = 20(1)- 1 = 2(0.841 3) -1 = 0.6826. 
a2) P[p - 2c < X < p + 2c] = 20(2) - 1 = 2(0.9772) - 1 = 0.9544 . 
a3) P[p - 3c < X < p + 3c] = 20(3) - 1 = 2(0.9987) - 1 = 0.9974 . 

NOTA. Si la distribution de X es no normal, por Chebyshev se tiene 

P[p - ka< X < p + kc] >1 — V- , k > 0 

k 2 
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b) De Plji-te < X < ji + Zca] = 2Q>(k)- \ = 0.5000 , resulta 0(*) = 0.7500 . 
Por otra parte, por interpolation, se tiene: 

valores de Z : 0.67 < k < 0.68 

areas respectivas : 0.7486 < 0.7500 < 0.7517. 

^ k - 0.67 0.7500-0.7486 

Ententes, = . 

0.68-0.67 0.7517-0.7486 



de donde resulta k = 0.67 + 0.0045 = 0.6745. 



EJEMPLO 7.17. 

Suponga que el ingreso familiar mensual en una tomunidad tiene distribution 
normal eon media $600 y desviaeion estandar $100. 

a) Caleular la probabilidad de que el ingreso de una familia escogida al azar sea menor 
que $400. 

b) Si el 5% de las familias eon mayores ingresos deben pagar un impuesto, ^a 
partir de que ingreso familiar se debe pagar el impuesto?. 

SOLUCION. 



Sea X la variable que representa los ingresos familiares mensuales La 
distribution de Xes N(600, (100) 2 ). 

a) />[ X < 400] = P[Z < 4 °° 1( - q - " 1 = p l z < “ 2] = 0.0228 

b) Se debe hallar K tal que, P[X > K\ - 0.05 o P[X < K] = 0.95 , entonces. 



0.95 = P[ X < K] = P[Z < K - - 6Q ° ] , de donde resulta 

100 

K = 764.5 . 



K - 600 
100 



- 1 .645 . 



EJEMPLO 7.18. 

Suponga que la duration X de los foeos que produee una eompanfa se distribuye 
normalmente. Si el 18 41% de estos focos duran menos de 8.2 meses y el 6.68% 
duran al menos 13 meses. 

a) Caleular la media y la varianza de la duration de los foeos. 

b) Hallar el euartil Q x de la distribution. 

c) Si el eosto de eada foto es de S/. 10 y se vende en S/.25, pero garantizando la 
devolution total del dinero si dura menos de 8 meses, ^cual es la utilidad 
esperada por foto?. 

d) Si mediante un nuevo proeeso se aumenta la duration en 10% mas 15 dias, c que 
poreentaje de foeos duran ahora menos de 7 meses?. 
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SOLUCION. 



Sea la variable aleatoria X, la duracion de los focos La distribucion de X es 

2 

normal con media \ x y varianza a 

a) Si el 18.41% duran menos de 8.2 meses, entonces P[X < 8.2] = 0.1841 , luego, 



0.1841 = P[X< 8 



.2] = P\Z < 



8.2 -n 



= o 



. a J 



de donde se obtiene — — — = -0.9, y p - 0.9a = 8.2. 
a 

Si el 6.68% duran al menos 13 meses, entonces, P[X > 13] =0.0668 , 



luego. 



0.9332 =P[X <13 ] = P 



Z< 



13-p ' 

a 




de donde resulta — — — = 1.50, y p + 1.5a = 13. 
a 

Resolviendo simultaneamente las ecuaciones resultantes, 

|i + 1 .5a = 1 3 
|i- 0.9a = 8.2 

se obtienen: |i = 1 0 , y a = 2 . 



b) El cuartil 1, Q x , satisface la condicion P[X < Q y ] = 0.25 , entonces, 



De P\Z < (£>, - 1 0) / 2] = 0.25 , resulta 10 = -0.67, £>i = 8.66. 

c) La utilidad f/ = — 1 0 si X<8,i7 = 15siX>8. La utilidad esperada es: 

E(U) = -10 P[X < 8] + 1 5P[X > 8] = -10 P[Z < -1] + 15P[Z > -1] 
E{U) = -10 x 0.1587 + 15 x 0.8413 = 1 1 .03 

d) Sea Y la duracion con el nuevo proceso, entonces Y =l.\X +0.5,y 

P[Y < 7] = P[X < 5.91] = P[Z < -2.05] = 0.0202 



EJEMPLO 7.19. 

En un proceso dc fabricacion de arandelas se estima que el diamctro interior 
varia de 12.319 mm. a 13.081 mm. El proposito para el que se destinan estas 
arandelas permiten una tolerancia en el diametro de 12.6 mm. a 12.9 mm., de otro 
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modo las arandelas se consideran defectuosas. Si el diametro de las arandelas es una 
variable aleatoria que se distribuye normalmente con media 12.7 mm. 

a) Calcular el porcentaje de arandelas defectuosas producidas 

b) y si se producen 2000 arandelas, calcular el numero esperado de arandelas 
aceptables. 

SOLUCION. 

Sea la variable aleatoria X el diametro interior de las arandelas. Se sabe que X 
tiene distribucion N(12.7,a ). 

Para determinar la desviacion estandar de la distribucion observemos que casi el 
100% del area total de la distribucion se incluye en el intervalo p + 3a , ya que 



P[p -3a < X < p + 3a] = 0.9974 . 



Por lo tanto, el rango R de valores de la variable X es aproximadamente: 
R = (p+ 3a) - (p- 3a): R = 6a o a= R/6 . 

Por otro lado, de los datos, R^X^ - X min =13 081 -12.319 = 0.762 - 
Luego, a = R/6 = 0.762/6 = 0.127 mm. 

La probabilidad de arandelas no defectuosas es 



P[12.6 < X < 12.9] = P 



12.6 - 12.7 
0.127 



<Z< 



12.9-12.7 

0.127 



= P[-0.79 < Z < 1 .57] = 0(1 .57) - 0>( -0.79) 



= 0.94 1 8 + 0.7852 - 1 - 0.7270 . 



a) El porcentaje de arandelas defectuosas es 100% - 72.7% = 27.3%. 

b) El numero esperado de arandelas aceptables es 2000x0.7270 = 1454. 

EJEMPLO 7.19 B 

Sea X una variable aleatoria continua cuyo modelo de probabilidad es: 

f(x) = -r± =*-**’-*+<>*> 

■Jit / 2 

Calcule la probabilidad de que X este en el intervalo [0 , 1.5] 
SOLUCION. 

La funcion de densidad de probabilidad corresponde a: A'~A ! (0-5, 0.5 2 ). 
Entonces, P[0 < X < 1..5] = P[-l < Z <2] = 0.8185 
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NOTA (Propiedad reproductiva de la normal). 

Si X, , X 2 ,...X k , son k variables aleatorias independientes, tales que 



q X, + c 2 X 2 + ... + c k X k (donde c,,c 2 c k son constantes reales) esta 

distribuida normalmente 



En particular, si las variables aleatorias X, Y tienen las distribuciones normales 
respectivas: X ~ A(p,,o 2 ), Y ~ /V(p 2 ,o 2 )* entonces, 

X + Y ~ N(p, + p 2 ,o 2 + a 2 ) y X - Y ~ - p 2 ,a 2 + a 2 ). 

EJEMPLO 7.20. 

Un producto cuyo peso se distribuye normalmente con un promedio de 250 
gramos y una desviacion estandar de 10 gramos es embalado en cajas de 4 
docenas cada una. Se supone que el peso de las cajas vacias se distribuyen 
normalmente con un promedio de 350 gramos y una desviacion estandar de 15 
gramos. Si los pesos del producto y de la caja son independientes, 

a) Calcular la probabilidad de que una caja llena pese menos de 12.5 kg. 

b) Cuantas cajas llenas seran necesarias para que el peso total sea al menos 
1 10,724.56 gramos con probabilidad de 0.9772. 

SOLUCION. 

Sean X,,X 2 ,...,X 48 las variables aleatorias que representa el peso de los 48 
productos, e Y la variable aleatoria que representa el peso de la caja. Se sabe que 
cada X, ~ M250,10 2 ) y que Y - N(350,15 2 ) . Entonces, el peso de la caja llena, 
es la variable aleatoria: 



X, ~ A(p f ,c 2 ) . para cada i = 1.2,...,A . entonces, la variable aleatoria 




48 




cuya distnbucion es normal con media: 



48 



E(W) = £ E( X, ) + E(Y) = 48(250) + 350 = 1 2,350 gramos. 



1=1 



y con varianza 



48 



Var(W ) = ^ Var(X t ) + Var( Y) = 48(1 00) + 225 = 5025 gramos 2 . 



i=l 
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Luego, 
a) P[W < 1 2,500] = P 



W -12,350 12,500-12,350 

> - 



= P[Z < 2 1 2] = 0.9830. 



70.89 70.89 

b) Sea U n =^W- , el peso de n cajas llenas, entonces, la variable aleatoria U n 

i=i 

normal con media 12,350 m y con varianza 5025 m. 

Se debe calcular n tal que P[U n >10,724.56]= 0.9772 , luego. 



0.0228 = p[U n < 1 10.724.56]= P 



Z< 



11 0,724.56 -12,350n 
-J 5025« 



. 11 0,724.56 -12,350/j 

de donde resulta, r — = = -2.00 , cuya solucion es n = 9 . 

V 5025m 



7.2.3 Distribuciones gamma, exponencial y 
chi-cuadrado 



7.2.3.1 Funcion Gamma. 

Definition. La funcion gamma denotada por, F , se define por: 

na)=|* x a -'e~ x dx. 

Jo 

donde a es un numero real positivo. 



Propiedades. 

1) Si a > 1 , entonces, T(a) = (a - l)r(a - 1) . 

En efecto, haciendo u = x a ~ 1 , dv - e~ x dx , en la funcion gamma, e integrando 
por partes, se obtiene. 
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T(a)= lim f-jc a l e x ] n + (a-l) f jc a 2 e X dx = 0 + (a-l) f jc a 2 e X dx 
b-++ oo L Jo Jo 

Luego, T(a) = (a - \)T(a - 1) . 

2 ) r(l)= Fe~ x dx = l. 

Jo 




4) Si a es igual a un numero entero: n > 1 , entonces, T(m) = (n - 1)! 

En efecto, aplicando: T(m) = (n- l)r(n - 1) , repetidamente, 
resulta, 

T(n) = (n~ 1)(m - 2)(#i - 3)...r(l) . 

Luego, T(n) = (n - 1)! . 



7.2.3.2 Distribucion gamma 

Definicion. Se dice que la variable aleatoria continua X tiene distribucion 
gamma, con parametros a , P y se representa por X ~ T(a,P) , si su funcion de 
densidad es: 



f(x) = 



P“ 



r(a) 

0 , 



Jt°-V p \ si 



si 



j :>0 

jc<0 



donde a y P son constantes positivas. 

La figura 7.5 es la grafica de la distribucion gamma cuando P = 1 , para 
a = 1 ,a = 2, a = 4 . 

TEOREMA 7.10. 

Si X ~ r(a,P) , entonces, a) Media: p= — , b) Varianza: a 2 =— . 

P P 2 
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PRUEBA. 

a) E(X) = 
Si p* = 

E(X) = 



b) E(X 2 )-- 
Si px = 

E(X 2 ) 

Luego, 



r x -PL x «-' e -v*dx= r 

Jo r(a) Jo T(a) 

|j. , entonces, 0 < u < +oo , y dx = du / P , luego, 

1 f°° a -u, 1 Ha + l) ar(a) a 

pr(a) Jo P T( a) pr(a) P 




Fig. 7.5 Grafica de la distribucion gamma con P = 1 




u entonces, dx-du /p y 

1 r° 1 T(a + 2) a(a + l)r(a) a(a + l) 

P 2 r(a) Jo p 2 r(a) P 2 r(a) p 2 

Var(X) = £(x 2 )-(£(X)) 2 = a(a + 1) _| S!l\ = “ 

p 2 l,p; p 2 
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7.2.3.3 Distribution exponencial 

Definition. Se dice que la variable aleatoria continua X tiene distribution 
exponencial con parametro P (P > 0), y se describe X ~ £xp(P) , si su funcion de 
^ensidad de probabilidades es: 



/(*)- 




si jc ^ 0 
si x < 0 



Su grafica es la figura 7.6. Es un modelo apropiado a vida util de objetos. 




Fig. 7.6. Grafica de la distribucion exponencial 



NOTA. La distribucion exponencial es un caso particular de la distribucion gamma 
cuando a = 1 . Luego, si la variable aleatoria X tiene distribucion exponencial con 
parametro p o X ~ T(1,P) , entonces tiene, 

1 2 1 

a) Media: p= — , b) Varianza. a = — 

p p 2 

Por otra parte, su funcion de distribucion acumulada en el intervalo [0,+oo[ es: , 



F(x ) = P[X<x]=[* p e~ Px dr = 1 - e~ p \ 0 < a < co. 

J 0 



Observar tambien que: P[X > a] = 1 — P[X < x] = e pjr , 0 < x < oo. 

Ademds, para numeros reales positivos s y t cualesquiera, se verifica: 
P[X >s + t/X >s] = P[X > r] 



En efecto. 



P[X>s + t/X>s] = 



P[X > ^ + r] 
P[X >s ] 



c - P <*+0 

e~* 



e~ p ' =P[X >t] 
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EJEMPLO 7.21. 

El tiempo durante el cual ciena marca de bateria trabaja en forma efectiva hasta 
que falle (tiempo de falla) se distribuye segun el modelo exponencial con un 
tiempo promedio de fallas igual a 360 dias. 

a) *,Que probabilidad hay que el tiempo de falla sea mayor que 400 dias?. Esta 
probabilidad es conocida tambien como confiabilidad de la bateria. 

b) Si una de esta s baterfas ha trabajado ya 400 dias, ^que probabilidad hay que 
trabaje mas de 200 dias mas?. 

c) Si se estan usando 5 de tales baterias calcular la probabilidad de que mas de dos 
de ellas continuen trabajando despues de 360 dias. 

SOLUCION. 

Sea X = el tiempo que trabaja la bateria hasta que falle. El tiempo promedio de 
falla es de 360 dias. Entonces, X ~ Exp( P = 1/360) y su funcion de densidad es: 

/(jc) = — e _ */ 360 , 0 < x < oo 

J 360 

a) P[X > 400] = e” 400 ' 360 = 0.329 

b) Si la bateria ya trabajo 400 dias, quiere decir que su tiempo de falla es mayor que 
400 dias. Luego, 

P[X > 400 + 200/ X > 400] = P[X > 200] - e -200 ' 360 = 0.574 

c) La probabilidad de que una bateria trabaje m£s de 360 dias es: 

p = P[X > 360] = <r 360/36 ° = e~ l = 0.368. 

Sea Y = # de baterfas de 5 que siguen trabajando despues de 360 dias, entonces, 
Y~ B(5,p),y 

2 

PIY>3] = \-P[Y <2] = l-^C^OJOgj^fO^) 5 '* =0.26376 

0 



NOTA. (Modelo exponencial y modelo de Poisson). 

Si X es el numero de veces que ocurre un evento en un perfodo dado con 
promedio X de ocurrencias, (esto es si X tiene distribucion de Poisson con 
promedio X), entonces, el tiempo que transcurre hasta que ocurre el primer evento 
de Poisson es una variable aleatoria continua que tiene distribucidn exponencial con 
para metro (3 == X. 



www.FreeLibros.me 



Distribuciones con tinuas 



305 



EJEMPLO 7.22. 

a) Sea X el numero de eventos de Poisson que ocurren en un intervalo de tiempo 

[0,/] con promedio Xt (X es el promedio en el intervalo [0, 1] ). Si T es el 
tiempo que transcurre hasta que ocurra el primer evento de Poisson verificar que 
T tiene distribucion exponencial con parametro P = X. 

b) Suponga que el numero de llamadas que llegan a una central telefonica tiene 
distribucion de Poisson con un promedio de 5 llamadas por minuto.^Cual es la 
probabilidad de que la primera llamada ocurra en a lo mas 30 segundos de haber 
sido puesto en marca de la central?. 

SOLUCION. 

a) X = # eventos de Poisson que ocurren en el intervalo [0, t]. Entonces, 

P[X=k]=- — 0^— k= 0,l,2,etc.. 
k\ 

Sea ^tiempo que transcurre hasta que ocurre el primer evento de Poisson El 
rango de T y es el intervalo R r = [0,+oo[ 

Primero se halla la funcion de distribucion acumulada F(t) de T y luego 
derivando esta se halla la funcion de densidad. Para t e R T se tiene : 

F{t) = P[T </] = !- P[T> t] = \-P\X =0] = l-e^. 



Donde, el evento [T > t\ indica que el primer evento de Poisson ocurre despues 
de t (o en el intervalo ]f,-Kc[ ) lo que es lo mismo que no ocurre ningun evento 
de Poisson en el intervalo [0, t]. Es decir, [T > t] = [X = 0] . Finalmente, 



/(o» 



dt 



t> 0. 



b) Sea X: # de llamadas que ocurren con un promedio de X = 5 por minuto. 

Sea T el tiempo en minutos que transcurre hasta que ocurra la primera llamada. 
Entonces, T es exponencial con parametro P = X = 5 . Su funcion de densidad es: 



/(r) = 5e 5r , 0<f<+oo 



La probabilidad que la primera llamada ocurra en el intervalo [0,1/2] es: 

P[T<l/2]= f 1/2 5e~ s '<* = l — «r 5/2 =0.918. 

Jo 

Observar que: P[T < 1/2] = 1 - P[T > 1/2] = 1 - P[X = 0] = 1 - c - 5x(1/2 > 
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El evento; [T >1/2]: “ocurre la primera llamada despues de 1/2 minuto” es 
igual al evento [X =0] “no ocurre ninguna llamada en el periodo 
[0,1/2] minutos con promedio Xt = 5x(l/2) ” 

NOTA. (Modelo Gamma y modelo de Poisson) 

La distribucion gamma describe la funcion de densidad de la variable aleatoria 
que representa el tiempo que transcurre hasta que ocurra un numero especffico de 
eventos de Poisson con promedio X. Este numero especffico es el parametro a, y 
P = X en la funcidn de densidad gamma. 

EJEMPLO 7.23. 

El numero de automoviles que llegan a un surtidor de gasolina se distribuyen 
segun el modelo de Poisson con un promedio de 2 autos por minuto. ^,Que 
probabilidad hay de que transcurran hasta dos minutos hasta que Ilegue el segundo 
auto, despues de haber puesto en marcha el surtidor?. 

SOLUCION. 

Sea X = # de autos que llegan al surtidor con promedio X = 2 en el periodo de 
un minuto. X se distribuye segun la ley de Poisson. 

Sea T el tiempo que transcurre hasta que Ilegue el segundo auto, despues de 
haber sido puesto en marcha el surtidor. Entonces, T tiene distribucion gamma con 
parametros a = 2 y P = 2. Esto es, T ~T(a = 2, P = 2). La probabilidad de que 
transcurran hasta 2 minutos hasta que Ilegue el segundo auto es: 

P[T < 2] = 4 £ te~ 2 'dt = 1 - e ~ 4 (1 + 4) = 0.908. 

Observe que: P[T < 2] = 1 - P[T > 2] = 1 - P[0 < X < 1] = 1 - e ~ 4 (1 +4) . 

El evento; [T > 2] : “transcurren mas de dos minutos hasta que Ilegue el segundo 
auto” es igual al evento [X < 1] :”llega a lo mas un auto en el periodo [0, 2] minutos 
con promedio Xt = 2x2 = 4” 



7.2.3.4 Distribucion Chi-cuadrado 

Definition. Se dice que la variable aleatoria continua X tiene distribucion chi- 
cuadrado con r grados de libertad, y se representa por X ~ y/' ( r ) , si su funcion 
de densidad es: 



/(*) = • 



2~ r/2 

nr/2) 



x r/2 -'e 



x/2 



0 , 



si jc> 0 
si x < 0 
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donde r es un numero entero positive*. 
Su grafica se da en la figura 7.7 




Fig. 7.7. Gr£fica de la distribucidn chi-cuadrado 

NOTA. La distribucidn chi-cuadrado es un caso particular de la distribucion 
gamma, cuando a = r/2 y P = 1/2 . Luego, si X~x 2 ( r )° s i X ~ F(r/2, 1/2), 
entonces, su media y su varianza respectivamente son: 

a) JLl = r y b) O 2 = 2r 



PROPIEDADES. 

Las siguientes proposiciones (cuya prueba omitimos) son de importancia para 
el desarrollo de este texto. 

1) Si Z ~ /V(0,1) , entonces, Z 2 ~x 2 0)- 

2) Si Z, ,Z 2 ,...,Z r , son r variables aleatorias independientes tales que 
Z, - N (0,1) , para cad a i= 1,2,3,...,/*, entonces, 

ix-xV) 

i=l 

Con frecuencia, % 2 ( r ) » se define como la suma de los cuadrados de r variables 
aleatorias independientes distribuidas cada una como 7V(0,1). 

3) Propiedad reproductiva de la distribucion chi-cuadrado 

Si X,,X 2 ,...,X ik , son k variables aleatorias independientes tales que 

X i ~ x 2 ( r i ) » cada i = 1,2,3 entonces. 
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k 

+r 2 +-+r*y 

1=1 

Uso de la tabla chi-cuadrado 

Si la variable aleatoria X se distribuye como una chi-cuadrado con r grados dc 
libertad, esto es, si X ~X 2 ( r )* entonces, en la tabla de probabilidades chi- 
cuadrado se puede encontrar una probabilidad 1-a o un valor c = X\-a.r- 
mediante la relacion 

como se indica en la figura 7.8. 




Fig. 7.8. GrSfica chi-cuadrado 



EJEMPLO 7.24. 

Si X ~ x (26) , determinar: 

a) P[X <17.29], b) P[X >38.89], 

c) P[\3M<X <45.64], d) P[X < 40]. 

SOLUCION. 

a) P[X <17.29] =0.10, 

b) P[X > 38.89] =1 - 0.95 = 0.05, 

c) P[13.84 < X < 45. 64] =0.99 - 0.025 = 0.965. 

d) Por interpolation: 

Valor de chi-cuadrado: 38.89 < 40 < 4 1 .92 

Area acumulada correspondiente: 0.95 < p 0 < 0.975 
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T Pq - 0.95 40 - 38.89 J J J 

Luego, — = , de donde resulta p Q = 0.9592. 

0.975-0.95 41.92-38.89 ™ 

EJEMPLO 7.25. 

Si X ~ x( r ) » hallar: 

a) a tal que P[X < a] = 0.995 , si r = 30. 

b) ay b tales que P[a < X < b] = 0.95 , P[X > b] = 0.025 . si r = 13 

c) atalque P[X < a] = 0.015 , si r = 8. 

SOLUCION. 

a) a = 53.67. 

b) De P[ X >b] = 0.025 , se tiene P[ X <b] = 0.975 , resultando b = 24. 74 

Por otra parte, 0.95 - P[a < X < b] = P[X < b] - P[X < a ] , 
de donde resulta, 

P[X < a] = 0.975 - 0.95 = 0.025 , entonces , a = 5.01. 

c) Por interpolacion: 

Area acumulada: 0.0 1 0 < 0.0 1 5 < 0.025 

valor de chi-cuadrado: 1.65 <a< 2.18 

. <3-1.65 0.015-0.010 J ^ 

luego, — = , de donde se obtiene a - 1 .8267. 

2.18-1.65 0.025-0.010 



7.2.4 Distribution t de Student 

Deflnicion. Se dice que una variable aleatoria continua T se distribuye segun t - 
student (mas brevemente segun t) con r grados de libertad y se representa por 
T ~ t(r) y s i su funcion de densidad es. 



/(0 



r[(r + 1)/2] 



T{r/2)‘r(n) 



f 2 V< r+1 >/2 

1 + ^- 



V 



J 



donde r es un entero positivo. 



- GO < t < OO, 



www.FreeLibros.me 



310 



Estadistica 



Su grafica es de forma campanoide como se representa en la figura 7 9 




Fig. 7.9. GrSfica de la distribution t-Student 
Se demuestra, en particular, que; 

"Si Zy V son dos variables aleatorias independientes tales que Z esta normalmente 
distribuida con media cero y varianza 1, y V est£ distribuida como chi-cuadrado con 
r grados de libertad, entonces, la variable aleatoria 




tiene distribucion t-Student con r grados de libertad”. 

Con frecuencia, la distribucion t con r grados de libertad es defimda como la 
distribucion de la variable T. 

La distribucion /-Student tiene las siguientes propiedades: 

1. Si X tiene distribucion t-Student con r grados de libertad, entonces su media y su 

varianza son respectivamente. 

a)p = 0, b) a 2 = — - — , r> 2. 

r — 2 

2. Su grafica tiene forma de campana de Gauss, simetrica en cero. 

3. La varianza de la distribucion t es mayor que de la distribucion /V(0,1) . Pero 

cuando r —> +oo , J a varianza de la t tiende a 1 . 

4. La distribucion t se aproxima a una distribucion yV(0. 1), cuando r — > +oo. La 

aproximacion es buena, si r > 30 . 



Uso de la tabla t-Student 

Si la variable aleatoria T tiene distribucidn /-Student con r grados de libertad. o 
T ~ f(r) , en la tabla de probabilidades t-Student se puede encontrar una 
probabilidad 1 - a o un valor c = f ,_ a r mediante la relacidn: 
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P[7-</ 1 _ ar ] = l-a 
como se indica en la figura 7.10. 




Fig. 7.10. Areas de la distribuci6n / 



EJEMPLO 7.26. 

Si X tiene distribution t-Student con 1 8 grados de libertad > hallar: 

a) P[X <2.101], b) P[X >1.734], 

c) P[X < -2.878], d) P[-1.330<X <2.552], e) P[X < 2]. 



SOLUCION. 

a) P[X < 2. 101] =0.975, 

b) P[X > 1 .734] =1 - 0.95 = 0.05, 

c) P[X < -2.878] =1 -P[X < 2.878] =1 -0.995 = 0.005. 



d) 0.990 -(1 -0.90) = 0.89. 

e) Por interpolation: 

Valor t 1.734 <2< 2.101 
areas respectivas : 0.95 < p 0 < 0.975 



Luego, 



Po-0-95 

0.975-0.95 



2-1.734 
2.101-1.734 ’ 



de donde resulta, p 0 = 0.968 . 



EJEMPLO 7.27. 

Si X tiene distribution t con 10 grados de libertad hallar el valor c tal que: 
a) P[X < c] = 0.995 , b) />[ X < c] = 0.05, 

c) P[X >c] = 0.01 d) P[-c<X<c] = 0.95, 

e) P[X < c] = 0.92 . 

SOLUCION. 

a) P[X < c] = 0.995, implica, c = 3.169. 

b) P[X<c]=0.05, implica. c=- 1.812. 

c) P[X>c] = 0.01, implica, P[X < c] = 0.99, luego c = 2.764. 
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d) P[-c < X < c] = 0.95, implica P[X <c]= 0.975, luego c = 2.228. 

e) Por interpolacion: 

Valor t : l .372 < c < 1 812 

areas respectivas : 0.90 < 0.92 < 0.95 

* c - 1 .372 0.92-0.90 . . , . t 

Luego, = , de donde resulta c = 1 .548 

1.812-1.372 0.95-0.90 



7.2.5 Distribucion F 

Definition. Se dice que una variable aleatoria continua X se distribuye segun F con 
r \ y r 2 g ra dos de libertad y se representa por F - F(r, ,r 2 ) , si su funcion de 
densidad es 




donde r x y r 2 , son numeros enleros positivos. Su grafica es la figura 7. 1 1 . 

Se demuestra, en particular, que si U y V son dos variables aleatorias 
indepeadientes tales que U~x 2 ( r i) y ' / '^X 2 ( r 2 )« entonces, la variable 

aleatoria: 

v/' i 

tiene distribucion F con r t y r 2 grados de libertad. 

Con frecuencia la distribucion F(r, , r 2 ) se define como la funcion de densidad 
de esta variable X. 
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Uso de la tabla F 

Si la variable aleatoria X ~ F(r x ,r 2 ) , en la tabla de probabilidades F se puede 
encontrar una probabilidad 1 - a o un valor c - F } _ a ^ r> , mediante la relation: 
P[X <c] = l - a , como se indicaen la figura 7.12. 

Para delerminar valores de F correspondientes a areas 1 -a = 0.005, 0.01, 
0.025, 0.05. o para determinar probabilidades correspondientes a valores de c < 1 se 
usa el teorema siguiente: 




TEOREMA 7.11. 

Si X tiene distribucion F con grados de hbertad r, y r 2 , enlonces, 1/ X tiene 
distribution F con grados de libertad r 2 y r, , esto es. 
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F = - 

* l-a,#j.r 2 



a.r 2 .ri 



PRUEBA. 



Luego, 



1 - a = p\f < F|_ a r r ]=p|i^-<cl = =1 -P 

l a.r,.r 2 J y v/ ^ j ^ /n C J [ 

/f^al=a. 

L^/n c\ 



V/r 2 1 
ty/r, -c 



Por otra parte, (V/r 2 )/(f//r,) se distribuye segun F ( r 2 entonces, 
1 r 

- = r , esto es, 

C 

F, = — 

I-a,r,,r 2 «n 

r a,r 2 .r } 



EJEMPLO 7.28. 

Si X ~ F( 4,5) hallar: 
a) P[X< 7.39], 

C) P[X<8], 

SOLUCION. 

a) FIX <7.39] =0.975, 

b) P[X >11.4] = 1-P|X <11.4]=1-0.99 = 0.01. 

c) Por inlerpolacion: 

valor de F : 7.39 < 8 < 1 1 .4 

Area correspondiente : 0.975 < p 0 < 0.99 



b) P[X >11.4], 
d) P[X <0.0645], 



Luego, 



Po -0.975 
0.99-0.975 



8-7.39 

11.4-7.39 



de donde resulta 



P o=0.977. 



d) Hay que hallar 1 - a tal que 4 5 = 0.0645 . Se sabe que: 



1 



ct.5,4 f 



1 - cx.4,5 



0.0645 



■ = 15.5 



de donde se obtiene a = 0.99 , luego, 1 - a = 0.01 
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EJEMPLO 7.29. 

Si X ~ F( 6,10) , buscar el valor de c tal que: 

a) P[X <c] = 0.99, b) P[X >c] = 0.05, 

c) P[X<c] = 0.025. 

SOLUCION. 



a) PI X < c] = 0.99 implica c = 5.39 . 



b) De P[ X > c] = 0.05, se obtiene P[X < c] = 95 , luego, c = 3.22. 

1 1 



C) F, 



0.025.6,10 



F 5 46 

0.975,10,6 



= 0.183. 



EJEMPLO 7.30. 

Si X ~F(15,12), hallar a y b tales que P[a<X <£>] = 0.90, sabiendo que 
P[X >6] = 0.05. 

SOLUCION. 



De P[X >b] = 0.05 , se obtiene P[X <b] = 0.95 , entonces, b = 2.62 . 

De 0.90 = F\a < X <b]= P[X < b] — F\X < a] , resulta P[X < a] = 0.05 . Luego, 

1 1 



a = F, 



0.05,15.12 



r 0 95,12.15 



2.48 



- = 0.4. 
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EJERCICIOS 



Uniforme 

1. Suponga que el tiempo X , en minutos, que demora una tarea tienc disiribucidn 

uniforme en [1,5]. Si el costo C para terminar la tarea es funcion del tiempo y 
es dada por la expresion 

C = 10+ X +3X 2 
calcular el valor esperado del costo 

Rp. EOQ= 3. VtX)=4/3. E( C)= 1 (>+3tf;0+£(X 2 )= 1 0 +3+3( V(X)+p : ) J=44. 

2. Los omnibus llegan a un paradero especifico en intervalos de 15 minutos 
comenzando a las 7 a.m.. Esto es, los omnibus llegan al paradero a las 7, 7 15. 
7.30, 7.45, y asf sucesivamente Si un pasajero llega al paradero en un tiempo 
que esta uniformemente distribuido entre las 7 a.m. y 8 a.m., calcular la 
probabilidad de que el pasajero espere: 

a) A lo mas 5 minutos por un omnibus 

b) mas de 10 minutos por un omnibus 

Rp. a) 7[10<7<I5 o 25<7<30 o 40<7<45 o 55<7<60]=4(5/60)=1/3. b) 4<5/60)=l/3. 

3 . Un vendedor tiene un sueldo fijo de S/.400 mas una comision del 5 % sobre el 
importe de las ventas que realiza. Si el importe de las ventas tiene una 
distribucion uniforme entre 0 y 3400 nuevos soles, 

a) Hallar el ingreso medio del vendedor, i,con que probabilidad obtendria al 
menos ese monto?. 

b) Se le ofrece como ingreso unico el 25% de sus ventas, si como mfnimo 
quiere ganar $480, ^le conviene la propuesta?. 

Rp. K=400+0.05X, X~U[0.3400], a) E(Y)= 485, Prob=0 5 b) 7[K>480J>7[0.25X>480]. No 

4 . Una de las clases de un determinado profesor esta programado para comenzar a 
las 8.10 a.m., pero el comienza su elase en un tiempo T que se distribuye 
uniformemente en el intervale de 8.05 a.m. a 8 15 a.m. ^Cual es la probabilidad 
de que el comience su clase, 

a) al menos dos minutos mas temprano?. 

b) a Io mas tres minutos mas tarde?. 

Rp. a)3/10. b) 3/10. 

5 . La llegada de cada uno de los empleados a su centro de labores se produce 
independientemente, de acuerdo a la distribucion uniforme en el intervalo 
comprendido entre las 8.00 y 8.25 a m. Si 10 empleados llegaron al centro de 
labores despues de las 8.10, ^cual es la probabilidad de que 4 de ellos hayan 
llegado entre las 8.15 y 8.20 a.m.?. 

Rp. X: #de exitos de 1 1 0, p), p-7[exito]-R[8 15<7<8.20/7>8.1]=l/3. 7[X=4]=0.2276. 
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6. La demanda en miles metros de determinada tela que tiene una companfa textil, 
se distribuye segun el modelo de uniforme en el intervalo [0,10], Por cada metro 
de tela vendida se gana 4$, pero por cada metro de tela no vendida en la 
temporada se pierde Sl.CalcuIar la produccion que maximiza la utilidad 
esperada de la companfa. 

Rp. X : demanda. X~U[0,I0], sea K la produccion Y: utilidad. Y=4K. si x>K . 

Y=4x-i(K-x ) , si x<K. £(!>= (-5tf 2 /20)+4Jf. £00 es maximo si 8 



Normal 

7. Suponga que la demanda mensual de un bien de consumo se distribuye 
normalmente con una media de 650 kilogramos y una desviacion estandar de 
100 kg. 

a) ^Que probabilidad hay de que la demanda no supere los 500 kg.?. 

b) iQu6 cantidad del bien debe haber mensualmente a fin de satisfacer la 
demanda en el 89.8% de los meses?. 

Rp. a) 0.0668. b) 777kg. 

8. El porcentaje del ingreso ahorrado por las familias tiene distribucion normal con 
una media del 10%. 

a) Determine la desviacion estandar, si el 2.28% de los ahorros son mayores 
que 12.4%. 

b) i,Que porcentaje de familias ahorro mas del 1 1 .974% de sus ingresos?. 

c) t.Cual es la probabilidad de que 3 familias de 5 tengas ahorros por mas del 
1 1 .974% de sus ingresos?. 

Rp. a) ct= 1.2, b) 0..05 b)0.001128. 

9. Una pequena Ciudad es abastecida de agua cada dos dfas. El consumo en 
volumen de agua (cada dos dfas) tiene distribucion normal. 

a) Determine la media y varianza de la distribucion si se sabe que el 0.62% del 
consumo es al menos de 22,500 litros y que el 1 .79% del consumo es a lo 
mas 17,900 litros. 

b) Hallar la capacidad del tanque de agua de la pequena Ciudad para que sea 
solo el 0.01 la probabilidad de que en el periodo de dos dfas el agua no sea 
suficiente para satisfacer toda la demanda. 

Rp. a) p = 20,000 litros. a = 1 .000 litros. b) 22.230 litros 



10. Las calificaciones 400 alumnos en una prueba final de Estadfstica se distnbuyen 
segun el modelo de probabilidad normal con una media de 12. 

a) Determine la desviacion estandar si la nota minima es 6 y la maxima es 1 8. 

b) Si la nota aprobatoria es 1 1, ^cuantos alumnos aprobaron el curso?. 

c) <.Que nota como mfmmo deberfa tener un alumno para estar ubicado en el 
quinto superior? 
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d) <,Que rango percentil tiene un alumno cuya nota es 14?. ^indique su orden 
de merito. 

Rp. a) o=2, b) 276.6=277. c) Ktal quc P[X>K]=0.20, A= 13.68.. d) PIX<14]=0.84 13, 15.87% 

11 . Los puntajes de una prueba de aptitud academica estan distribuidos 
normalmente con una media de 60 y una desviacion estandar de 10 puntos. 

a) Si el 12.3% de los alumnos con mayor puntaje reciben el calificativo A y el 
20% de los alumnos con menor nota reciben el calificativo C, calcular el 
mmimo puntaje que debe tener un alumno para recibir una A, y el maximo 
puntaje que debe tener un alumno para recibir una C. 

b) Si el resto de los alumnos recibe el calificativo B y si el total de alumnos es 
igual a 90, ^cuantos alumnos recibieron el calificativo de A, B y C?. 

Rp. a) p=60,a=l0. b)A=71.6. C=51.6. c) A:1 1. B:61. C:18. 



12. Las calificaeiones de una prueba final de Matematica Basica tienen distribucion 
normal con una media igual a 8. Si el 6.68% de los examinados tienen nota 
aprobatoria (mayor o igual a 11), ^como debe modificarse cada nota para 
conseguir un 45% de aprobados?. 

Rp. ct= 2.. *=nota a anadir. 0.13=(ll-(8+k))/2, k= 2.74. 



13 . Suponga que el ingreso familiar mensual (X) en una comunidad tiene distribucion 

normal con media $400 y desviacion estandar $50. 

a) Si el decimo superior de los ingresos debe pagar un impuesto, ^a partir de 
que ingreso familiar pagan el impuesto?. 

b) Si el ahorro familiar esta dada por la relacion Y = ( 1 / 4) X -50 , ^cual es la 
probabilidad de que el ahorro sea superior a $75? 

c) Si escogen dos familias al azar, ^que probabilidad hay de que una de ellas 
tenga ingresos mayores a $498 y la otra menores que $302? 

" Rp a) K lal que, P[X>/C]=0. 1 0. 464. b) P[y>75|= P[X>500| =0.0228, c) 2x0.025x0.025 

14 . Una pieza es considcrada defectuosa y por lo tanto rechazada si su diametro es 

mayor que 2.02 cm. O es menor que 1.98 cm.. Suponga que los diametros tienen 

distribucion normal con media de 2 cm. y desviacion estandar de 0.01 cm. 

a) Calcular la probabilidad de que una pieza sea rechazada 

b) ^Cual es el numero esperado de piezas rechazadas de un lote de 10.000 
piezas?. 

c) Si se escogen 4 piezas al azar, ^cua! es la probabilidad de que 2 de ellos sean 
defectuosos?. 

d) Se necesitan 4 piezas sin defecto para una maquina. Si estos se prueban uno 
a uno sin reposicion, ^cual es la probabilidad de que la cuarta pieza buena 
sea la sexta probada?. 

Rp. a) p=0.045G. b) n/?= 10,000x0 0456=456 c' C \ p\ \ -p)\ d) Cj (I -p)V 
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15 . Un gerente viaja diariamente en automovil de su casa a su oficina y ha 
encontrado que el tiempo empleado en el viaje sigue una distribucion normal 
con media de 35.5 minutos y desviacion estandar de 3 minutos. Si sale de su 
casa todos los dfas a las 8.20 a.m. y debe estar en la oficina a las 9 a.m. 

a) ^Cual es la probabilidad de que llegue tarde en un dfa determinado? 

b) ^Que probabilidad hay de que llegue a tiempo a la oficina 3 dfas 

consecutivos?. Suponga independencia Rp. a) 0.0668. b) (0.9332) 3 

16 . Cierto lfquido industrial contiene un porcentaje X por galon de un compuesto 
particular cuya distribucion es normal con una media de 15 % y una desviacion 
estandar de 3%. El fabricante tiene una utilidad neta de $0.15. si 9 < X < 21 , de 
$0. 10, si 2 1 < X < 27 , y una perdida de $.05, si 3 < X < 9 . calcular la utilidad 
esperada por galon. 

Rp. valores: -0.05. 0.15, 0.10, prob. : 0.0228, 0.9544. 0.0228. espera: 0.14$. 



17 . Un exportador recibe sacos de cafe de un quintal al mismo tiempo de dos 
proveedores A (Chanchamayo) y B (Quillabamaba). El 40% recibe de A y el 
resto de B. El porcentaje de granos con impurezas por saco es una variable 
aleatoria cuyo modelo de probabilidad es normal con media y desviacion 
estandar respectivas de 6% y 2% para A, y de 8% y de 3% para B . 

Si el exportador selecciona un saco al azar 

a) *',Que probabilidad hay de que el porcentaje de granos con impurezas 
supere el 10%? 

b) y encuentra que el porcentaje de granos con impurezas supere el 10%, ' 
^que probabilidad hay de que provenga de Chanahmayo?. 

Rp. a) P= 0 4x/ > [Z>2]+0.6xf , [Z>0.67]=0-4x0.0228+0.6x0.2514=0. 15996, b) 0.4x0.0228/ 0.15996. 



18 . Una fabrica cuenta con 3 maquinas: A, B y C donde la maquina A produce 
diariamente el triple de B y esta el doble de C. Ademas se sabe que el peso de 
los artfeulos producidos por A se distribuye exponencialmente con una media de 
5 Kg., el peso de los artfeulos producidos por B se distribuyen uniformemente 
entre 3 Kg. y 8 Kg., mientras que el peso de los artfeulos producidos por C se 
distribuye normalmente con una media de 6 Kg. y una desviacion estandar de 
2Kg. Si se extrae al azar un artfculo: 

a) ^Cual es la probabilidad de que pese a lo mas 5 Kg.?. 

b) Si pesa mas de 5 Kg., ^Cual es la probabilidad de que haya sido fabricado 
por la maquina A?. 

Rp. £=peso <5, a) P(£X6/9)x0.6321 +(2/9)x 0.4 + (l/9)x0.3085=0.5446, 
b) P(A/E c )=P(A)P(E c '/AyP(^)=(6/9){036'I9)/0A554. 

19 . El monto de consumo que registra una cajera de un supermercado en una dfa 
cualquiera es una variable aleatoria que tiene distribucion normal con media 
$200 y desviacion estandar $50. 
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a) En este supermercado solo el 5% de los elientes se considera un excelente 
cliente y por tanto como promotion puede recibir un 10% de descuento, <a 
partir de que consume un cliente se beneficiara de la promotion?. 

b) Actualmente el 30% de los elientes tiene un consumo considerado como 
minimo. La empresa considera que en base a la promocion en unos meses 
solo el 20% de los elientes consumira debajo de ese monto, ^cuanto dinero 
adicional tendra que gastar cada cliente para que esto se cumpla?. 

Rp. X-M200, (50) 2 ), a) k tal que P[X>k]=0m , k= 282.25, b) P[X<c]=0.30, c= 1 74. Sea d dinero 
adicional, Y=X+d , Y~ N{200+d, (50) 2 ), hallar d tal que, P[Y< 1 74] -0 20., </= 16. 

20. Suponga que el costo de consumo por persona en un restaurante se distribuye 
normalmente con una desviacion estandar igual a $5. Si se sabe que el 15.87% 
de los elientes han pagado mas de $15 y que 1 12 personas pagaron menos de 
$7.1, ^cuantas personas comieron en el restaurante?. 

Rp. p =$10, 400 personas. 



Propiedad reproductiva de la normal 

21 . Los pesos de los posibles usuarios de un ascensor constituyen una poblacion 
cuya distribucion es normal con una media de 70 kg. y una desviacion estandar 
de 10 kg. 

a) ^Que peso maximo deberfa poder soporlar el ascensor de modo que solo el 
1% de las ocasiones el peso de 4 personas supere ese peso maximo?. 

b) Si el ascensor admite como peso maximo 585 kgT, ^cuantas personas a la vez 
pueden entrar al ascensor de manera que sea 0.0668 la probabilidad de que el 
peso no supere el maximo permitido?. 

Rp. a) k =326.6 kg. , b) #i=9 

22. Se ha determinado que los salarios, en dolares, de las parejas dc esposos son 
independientes y que la distribucion es N( 350, 50 2 ) para los hombres y 
/V(250,35 2 ) para las mujeres 

a) <Cual es la probabilidad de que el ingreso familiar sea superior a $720.? 

b) Si se escoge al azar una pareja de esposos, ^cual es la probabilidad de que el 
sueldo del esposo sea mayor que el sueldo de la esposa? 

c) Si se escoge al azar una pareja de esposos, ^cual es la probabilidad de que 
cada ingreso sea mas de $300?. 

Rp. a) 0.0244, b) P[H>M]=P[H-M> 0]= P[Z>(0- 1 00)/6 1 .033]= 0.9495 
c) P[tf>300 AA/>300]=f > [//>300]xP[A/>300]=HZ>-l]xP[Z>1.43]= 0.0643. 

23 . Suponga que el peso de las botellas vacias de gaseosas tienen un peso con 
distribucion normal de media 0.4 kg. y desviacion estandar 0.01 kg. El peso del 
lfquido que se depositan en las botellas tiene una distribucion normal con media 
0.7 kg y desviacion estandar 0.05 kg. Los pesos de las cajas vacias donde se 
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colocan las botellas tienen una distribution normal de media 2 kg y desviacion 
estandar 0.05 kg.. Si cada caja contiene 12 botellas Menas de tal gaseosa; 

a) ^Cual es la probabilidad de que el peso de una caja de 12 botellas llenas pese 
menos de 15 kg?. 

b) Si se tienen 10 cajas llenas, ^cual es la probabilidad de que 8 de ellas pesen 
menos de 15 kg?. 

Rp. a) X=peso total de una caja~/V(l5.2. (0.1836) 2 ),p=/ > IX<15J=0.1379. b) Cg°p 8 (l-p) 2 

24 . La temperatura de un objeto es una variable aleatoria con modelo de 
probabilidad f (x) = (l / -Jn)e x \ -axjc<+oo. Cierto tipo de artfculo tiene un 
precio de venta fijo de 25 unidades monetarias (u.m.) y un costo variable que es 
N( 5,1). ^Cual es la probabilidad de que la venta de 6 artfculos origine una 
utilidad neta total mayor que 125 u.m.?. 

Rp. 0.0207. 

Gamma y exponential 

25 . La distribucion de la duration en meses de cierto tipo de objeto es exponential 
con parametro p, ^cual es el valor de p si se sabe que hay una probabilidad de 
0.7 de que uno de estos objetos tenga una duration a lo mas de 6 meses?. 

Rp. p - 0.2. 

26 . Suponga que el tiempo de vida util de un modelo de computadora es una 
variable aleatoria con distribucion exponencial cuya media es 10 meses. 

a) Si el costo del montaje de cada computadora es $660 y la venta es $1000, 
determ inar la utilidad esperada por cada computadora sabiendo que el 
distribuidor cambia por otro nuevo si dura menos de 5 meses. 

b) Una empresa adquiere 10 de tales computadoras, <,cual es la probabilidad de 
que al menos 1 dure al menos 12 meses? 

Rp. a) ~320( 1 -e~° 5 )+ 340(e“° 5 )=80.3, b) X~B(W.p), p=03. P[X>\ 1-0.972. 

27 . La vida util de una baterfa en anos es una variable aleatoria X con la funcion de 
densidad: 

f(x) = 0.2e~ o2x . x>0. 

El fabricante ofrece una garantfa de un ano. Si la baterfa falla en ese perfodo se 
reemplaza por otra, a lo mas una sola vez. Si el costo de fabrication es de $20 
por tada baterfa y se vende a $50 cada una, 

a) ^Cual es la utilidad esperada del fabricante? 

b) ^Cual debe ser el tiempo de garantfa que el fabricante debe ofrecer para que 
solo devuelva el 5% de las baterfas producidas?. 

Rp. a) 30(e 0 2 )+l 0( 1 -e*° 2 )=26.37. b) 0.05 =P[X<k], *=0.2564 

28. El 90% de los objetos de un proceso de production son clasificados como 
buenos y el resto como defectuosos. Si la vida util (en anos) de los objetos 
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defectuosos y buenos se distribuyen ambos exponencialmentc con medias 
respectivas 0.2 anos y 0.5 anos, 

a) ^Cual es la probabilidad de quc un objeto scleccionado al azar dure a lo mas 
un ano?. 

b) Si el objeto seleccionado al azar dura a Io mas un ano, ^cual cs la 
probabilidad de quc hay a sido seleccionado de la produccion dcfectuosa?. 

Rp X duracion. D: defectuoso, E={X< 1 }. a) Pi E)~P(D)P( E/D)+Pi D c )Pi D v /E). 

P(E)=0.!x(1-£ V0.9x( 1-^ 3 )=0.8775, b) P( D/£>=0.0993/0. 8775. 

29. La conflabilidad de una componente (o un sistema) durante un periodo r es la 
probabilidad de que su tiempo de falla exceda t. Esto es, la conflabilidad cs 
R(t)=P[T>tl 

Un fabricante ha determinado que el tiempo de falla en meses de cierto modelo 
de motor tiene la funcion de densidad 

/(/) = 0.025<?' 0 025 '. t> 0 

a) Determinar la conflabilidad del motor para un periodo de 4 anos. 

b) Si el tiempo de falla del motor excede el tiempo promedio de falla, ^cual es 
la probabilidad de que cxceda un afio mas? 

c) Hallar el periodo en el cual el motor tiene una conflabilidad igual 0.325. 

Rp. a) /?(48)=P[7M8]=e 1 2 =0.3. b) P[X>40f I2/X>40]= P[X>12]=e _(, \ c) e k(0 0251 =0.325, 

k-44.96^45. 

30. La distribucion de la duracion de los fusibles que produce un fabricante tanto 

por el proceso I como por el proceso II es exponencial con medias respectivas 
de 100 y 150 horas. Los costos de fabricacion por fusible y para cada proceso 
son $0.5 y $0.8 respcclivamente. Sin embargo, si cualquier fusible dura menos 
de 200 horas, se carga una perdida de $0.2 en contra del fabricante, ^en cuanto 
deberian venderse los fusibles de cada tipo si se espera una utilidad de $1 en 
cada caso?. Rp. $ l 67 y $ 1 95. 

31. El numcro de clientes que usan tarjetas de credito pasan por la caja 25 de un 
supermercado a razon de 15 por hora, siguiendo un proceso de Poisson, ^que 
probabilidad hay de que 

a) transcurra mas de 10 minutos para que pase el primer cliente por la caja 257, 

b) el 2do cliente pase por la caja 25 cinco minutos despues de puesta en marcha 
la caja?. 

Rp. a )T- r(a=I,p=5/2), P[7^10J=/>[X=0J=e“ s/2 , b) r~r(a=2,p=L/4), P[7>5]=P[X<l]=e (V4, [ 1+5/4] 

32. Se ha determinado que en promedio la demanda por un artfculo en particular en 
una bodega era 1 cada 20 minutos. Considerando que el numero de articulos 
demandados se distribuye segun la ley de Poisson, halle la probabilidad de que 
el quinto artfculo sea demandado despues de dos horas que se abrio la bodega. 

Rp. P[T> 1 20]=P[X<4]=e‘^6 n /0!+. . .+ e -V/4!=0 285. r~r(a=5.3=I/20). en minutos X~P{ 6) 
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7.3 Teorema del limite central 



Uno de los teoremas sobre limite que justifica la importance que tiene la 
distribucion normal es denominado teorema del limite central. Este teorema nos 
permite aproximar a la distribucion normal sumas finitas de variables aleatorias 
independientes que pueden tener cualquier clase de distribucion con medias y 
varianzas conocidas. 

Se dice que n variables aleatorias X,,X 2 , , X n tienen la misma distribucion 

de probabilidad con media p y varianza a 2 si, tienen la misma funcion de 
probabilidad en el caso discreto, o la misma funcion de densidad en el caso 
conti nuo, y si ademas, 

£(X i ) = p, Var(X ,) = cr 2 para i = 1,2,3 ,..., n 

Si estas n variables aleatorias son independientes, entonces, la variable aleatoria 
Y n =Xj + X 2 + -•« + X ny tiene: 

media E(y n ) ° Mr 

y Varianza Var(Y n ) o =no 2 

TEOREMA 7.12 

Si X 1 ,X 2 ,'-*,X W son n variables aleatorias independientes igualmente 

distribuidas con media p y varianza a 2 , entonces, la distribucion de la variable 
aleatoria: 



Z = 






n 

z*.- 



n\i 



°Y n a 4n 

tiende a la distribucion normal yV(0,l), cuando n tiende al infinito. 



Estoes, lim P\z <&]=— f e 1 ^dt = 



O(b). 
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NOTAS. 

1. La distribucion de la variable alcatoria Y n = X, + X 2 + ••• + X n es 
aproximadamente normal con media , y con desviacion estandar 

g Yh Luego, 

P[Y n <b\=P 

La aproximacion es buena si n > 30 . 

2. Si la variable aleatoria Y n = X x + X 2 + *** + X n es discreta y con valores entcros 

consecutivos, entonces, 

P[Y„ = *]s p[k - 0.5 <Y n <k + 0.5] 
y P\a < Y n <b\=P\a - 0.5 <Y n <b + 0.5]. 

El ajuste de 0.5 se denomina factor de correction por continuidad 

EJEMPLO 7.31 

Sean X A , X 2 ,*** f X 50 , 50 variables aleatorias indepcndicnies cada una 

distribuida segun la funcion de probabilidad de la figura 7.13. Calcular la 
probabilidad 

p[x, +X 2 +...+ X 50 >55], 







SOLUCION. 

De la figura 7.13 se deduce que cada variable aleatoria X t tiene la distribucion 
de probabilidad dada por la tabla que sigue: 
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su media y su varianza son respectivamente: 




l/ fl r(X I .) = £(x, 2 )-[£(X | .)] 2 =0 2 ^ + l 2 ^j + 2 2 ^j-1 2 =i 



Jt 


0 


1 


2 


f(x) = P[X=x 1 


1/4 


1/2 


1/4 



Si la variable aleatoria, Y 50 = X x + X 2 + + X 50 , entonces, 

50 

£(K 50 ) = £(X 1 +X 2 +...+ xJ = £e(X i ) = 50(1) = 50 

i= 1 

f 50 ^ 50 . 

= ^ Viar( X f ) = 50(— ) = 25 

V i=i ) <=i 2 

Por el teorema del limite central, la variable aleatoria: 

„ y 50 -£(r 50 ) r 50 -50 

>^(r 50 ) 5 

tiene distribucion aproximadamente normal /V(0,1) Entonces, 

P[r 50 > 55] = 1 - pfKjo < 55] = 1 - P[Y X < 55.5] = 1 - p\z < 55 5 

Luego, P[r 50 > 55] s 1 - P[Z < 1 . 1] = 1 - 0.8643 = 0. 1 357. 

EJEMPLO 7.32 

El costo de un producto consiste de un valor fijo de $5 y de un valor variable 
que es el 5% de la garantia. Suponga que la garantia tiene distribucion uniforme 
entre $0 y $200. Si el producto se vende en $ 1 5 

a) Calcule la probabilidad de que la utilidad de 50 unidades del producto supere 
los $290. 

b) ^Cuantas unidades del producto serian necesarias vender para que con 
probabilidad 0.5 la utilidad sea al menos $300? 

SOLUCION. 

Sea Yj la utilidad y X i el costo variable de la i-esima unidad del producto. 



Var{Y 50 ) = Var 



I*. 
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La variable X , ~ U[0> 200] , con media y varianza respectivas: 



£( x f) -2±M. IO o. ^ i)= (200z0) 2 = 200l 

* 2 ' 12 12 

Lautilidad: Y, = 15-(5 + 0.05X, ) = 10-0.05*,. 

Entonces, la media y la varianza de Y : son respectivamente: 

E(Y,) = 5 y V(Y<) = ^- 

50 

a) Sea U S0 ='^Y j la utilidad que producen 50 unidades del producto. Entonces. 

i-l 

la variable aieatoria estandar: 

Uso- 50(5) _ t/ 50 - 250 



^50 



Luego, P[t/ 50 > 290] = P 



^50(100/12) 20.41 

290-250 



- = N(0,1). 



^50 >_ 



20.41 



= P[Z 50 >1.961 = 0.025. 



b) Sea £/„ =J'y j la utilidad que producen n unidades del producto. entonces, la 
variable aieatoria estandar: 

z„= “*~ 5n = /V(0,1). 

VlOOw/12 

Se debe determinar el valor de n tal que > 300] = 0.5 . Entonces, 

300 - 5n 



P^,, > 300] s P 



Z > 



" v ^n( 100/1 2) 

300 - 5n 



= 0.5 



De donde resulta 



( 100 / 12 ) 

n = 60. 



= 0 
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EJEMPLO 7.33 

Una maquina automatica envasa un bien de consumo diario en bolsas cuyo peso 
total tiene una media de 25 gramos y una desviacion estandar de 1 gramo Una 
segunda maquina empaca estas bolsas en paquetes de 12 docenas. Con el fin de 
verificar si el numero de unidades es realmente 144 en cada paquete, se escoge uno 
al azar y se adopta la siguiente regia de decision, si el peso del paquete esta entre 
3576 y 3624 gramos se acepta que el paquete tiene 144 bolsas, de otro modo se 
rechaza. Calcular la probabilidad de que, 

a) Un paquete que realmente tiene 144 bolsas sea considerado como si no los 
tuviera. 

b) Un paquete que tiene 142 bolsas sea considerado como si tuviera 144 
bolsas. 

SOLUCION. 

Sea X ( el peso de la bolsa i, / = 1, 2,.. .,144 La distnbucidn de cada X i es de 
forma desconocida, pero tienen, 

£(*,)= 25 ,y K(X,)=1. 

144 

a) Sea la variable aleatoria: ^144 “ ^ % i e! peso de un paquete de 144 bolsas, 

#=i 

entonces: £(^144 ) = n\i = 144 x 25gr. = 3600gr. 



Var(Y ]44 ) = no 2 =144xlgr 2 =144gr 2 .' 

Por el teorema central del limite, la variable aleatoria: 
y _ P |44 ~ E(Y^ / ^ a ) ^ P |44 — 3600 

VMjw) 

tiene distribucion aproximadamente normal MO, 1 ). Luego, 

P[Pi 44 < 3576 o Y ]44 > 3624] = 1 - P[3576 < K 144 < 3624] = 0.0456 
donde 



P[3576<y 144 <3624]=P 



3576 - 3600 , 3624 - 3600 

<Z <- 



12 



12 



= p[- 2 < Z < 2]= 0 9544. 
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142 

b) Sea la variable aleatoria: ^142 - ^ %i el peso de un paquete de 142 bolsas, 

»=i 

entonces, 

E(Y ] 42 ) = #i*i = 142 x 25 gr. = 3550gr. 

Var(Y l42 ) = no 2 =142x1 gr 2 =142 gr 2 

Por el teorema central del limite, la variable aleatoria: 

7 _ ^144 ~ ^(^144 ) _ ^144 ~ 3550 
Vv«r(K,44 ) 11916 

tiene distribucion aproximadamente normal N(0 ,1 ). Luego, 

P[3576 < K 142 < 3624]= P 



3576 - 3550 < < 3624 - 3550 



11.916 11.916 

= P[2.18<Z <6.21] = 0.0146. 



EJEMPLO 7.34 

Suponga que la vida util de una componente electrica de trabajo continuado 
tiene distribucion exponencial con un promedio de 100 horas. Tan pronto como sc 
detenora la componente, es reemplazada por otra para contmuar con el trabajo 

a) Calcular la probabilidad de que durante 209 5 dias, se necesiten mas de 36 
de estas components. 

b) ^Cuantas de estas componentes se necesitan para que duren al menos 4,536 
horas con una probabilidad de 0.9901?. 

SOLUCION. 

Sea la variable aleatoria X f la duracion de la componente i, i = 1, 2, 3,..., n . Las 
variables aleatorias X, son independientes y estan distribuidas cada una 
exponencialmente con media p= 100 horas y con desviacion estandar igual a la 
media esto es, a = 100 horas. El tiempo total que duran las n componentes es la 
variable aleatona: 

r n =!>. 

entonces, E(y , ll ) = nn = 100n y Var(Y„)-na 2 =100 2 n 
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Por el teorema central del limite, la variable aleatoria : 
z Y n -E(Y a ) _ Y n -\00n 
JVar(Y n ) \00-j7i 



tiene distribucion aproximadamente normal N( 0,1). 

a) Se necesitan mas de 36 componentes durante 209.5 dias, si la vida util total es 
menor que 5,028 horas (209.5 por 24 horas). Luego, hay que calcular 



p[K 16 < 5,028] =P 



-36 



5,028-36(100) 

100^36 



= P[Z 36 <2.38] = 0.99 13 



b) Se debe calcular n tal que P[Y n > 4,536] = 0.9901 , luego. 



0.0099 = P[Y n <4536] = P 



Z„ < 



4,536 - 100« 



iooV« 



2.33 = 



4,536 - WOn 



de donde resulta, 



100 <Jn 

100n-233>/n -4,536 = 0 
n = 64. 



7.3.1 Aproximaciones a la distribucion normal 

7.3.1. 1 Aproximacion de la binomial a la normal 

Sean X ] , X n , n variables aleatorias independientes e identicamente 

distribuidas segun el modelo Bernoulli con parametro p Cada variable X i , tiene 
media p x - p y varianza o x = pq , siendo q = \-p. Luego, la variable 
aleatoria: 

i=i 

tiene distribuci6n binomial con media |i x = tip y con varianza cr x = tipq . 
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Por el teorema central del lfmite, la variable aleatoria estandar: 



Z -— — ■- — 



X - np 
■Jnpq 



tiene aproxunadamente distribucion normal /V(0,1), cuando n es sufic ientemente 
grande. 

Luego, si X es una variable aleatoria binomial con media np y varianza npq , 
entonces, cuando n — > +oo la distribucion de la variable aleatoria: 



Z = 



X - np 
Jnpq 



es aproximadamente la distribucion normal N( 0, 1 ). 



La aproximacion es buena si n > 30 . Si n < 30 , la aproximacion es buena si p 
es cercano a 0.5. Cuanto mas se aleja p de 0.5, se requiere n cada vez mas grande 
para tener una aproximacion aceptable. 

Ademas, se puede tener mayor precision en la aproximacion si se utiliza la 
correction por continuidad de los valores discretos de la variable, sumando o 
restando 0.5 como sigue: 



P[a <X <b]~P[a-0.5<X <b + 0.5] = Q> 



b + 0 5 - np 

yfnpq 



- 4 > 



a - 0.5 — np 
Jnpq 



y P[X=A] = P[A:-0.5<X <k + 0.5] 



EJEMPLO 7.35 

El gerente de ventas de TV cable estima en 30% la proporcion de clientes 
morosos. Si se selecciona al azar una muestra de 200 clientes 

a) Halle la probabilidad de que mas de 50 de ellos sean morosos 

b) ^Cual es la probabilidad de que exactamente 70 clientes sean morosos?. 

c) Calcule la probabilidad de que el numero de clientes morosos de la muestra 
difiera del promedio en no mas de 14 clientes. si en verdad es 0.2 la 
proporcion de clientes morosos. 

SOLUCION 

Sea X el numero de clientes morosos en la muestra. Entonces X tiene 
distribucion binomial B(n , p ) , donde n = 200, p =0.3. 
a) La probabilidad de que mas de 50 clientes de la muestra sean morosos es: 
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200 

P[X >50] = P[X >51] = ^C* 200 (0.3)* (0.7) 
*=51 



>. 200 -* 



Utilizando la aproximacion a la normal 7V(p,c 2 ) , de la variable binomial X se 
tiene: 

p = np = 200x0.3=60 a = ^ Jnpq = V200x0 3x0.7 = 648., 

gQ 

y que Z = - es aproximadamente distribuida como normal N(0 t \). Luego, 



6.48 

P[X > 50] = P[X > 50.5] = P 



Z> 



50.5-60 



6.48 



= P[Z> -1.47] = 0.9292 



b) P[X = 70] = C 2 ^°(0.3) 7 °(0.7) i; ' 0 

Utilizando la aproximacion a la normal de la variable binomial X se tiene que 
X — 60 

Z = - ^ es aproximadamente distribuida como normal M0,1 ). Por tanto, 

P[X = 70] & P[69.5 < X < 70.5] = P[1.47 <Z < 1 .62] = 0.0182. 

x ^ ^ X-np X -200x0.2 X-40 

c) bn este caso, Z = — ■ — 1 - = - - ■ = es aproximadamente 

Jnpq V 200x0.2x0.8 5.657 

distribuida como normal 7V(0.1 ). Por tanto. 



P[|A , -n|<14] = / 3 



o 

1 


- 14 1 


5.657 


5.657 



= P[|z|< 2.47] = 0.9864 



7.3. 1.2 Aproximacion de la hipergeometrica a la 
normal 

Sea X la variable aleatoria hipergeometrica. esto es, el numero de exitos que se 
encueniran en una muestra de tamano n escogida al azar una a una sin reposicion de 
N elementos de los cuales r son clasificados como exitos y el resto N - r como 
fracasos. La media y la varianza de la variable son respectivamente: 

\x = np y c 2 =npq — j donde p = r/N , y q-\-p . 
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Cuando n — » +co 



X - np 




es aproximadamente la distribution yV(0,l ). 

EJEMPLO 7.36 

Los 1000 sacos de cafe de un quintal cada uno, producto de la ultima cosecha en 
Chanchamayo, se envian a una empresa exportadora para su venta a USA. La 
empresa exportara el producto si una muestra aleatoria de 80 sacos (revisados uno 
por uno) revela a lo mas 12.5% de sacos que no cumplen las especificaciones, en 
caso contrario no lo exportara. Calcular la probabilidad de no exportar el producto 
cuando realmente el porcentaje de sacos que no cumplen las especificaciones es 
10% del total. 

SOLUCION. 

Sea X la variable aleatoria que denota el numero de sacos de cafe de un quintal 
que no cumplen las especificaciones en la muestra de n = 80 escogida de la 
poblacion finita de 1000 sacos de los cuales 100 no cumplen las especificaciones.. 
Entonces, X tiene distribution hipergeometrica H{ 1 000, 1 00,80). 

El producto sera exportado si el numero de sacos que no cumplen las 
especificaciones en la muestra es 10 o menos (a lo mas el 12.5% de 80). Luego la 
probabilidad de que el producto no sea exportado es: 



P[X>10] = l-P[X<10] = l-£-— - 




Para calcular la suma, utilizamos la aproximacion normal X = N(p, a 2 ) , de la 



variable hipergeometrica X donde, p - np - 80 x = 8 



1000 




Por el teorema central del limite la variable Z = 



tiene distribucidn 

2.547 



aproximadamente normal yV(0,l). 
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Por tanto. 



10 - 100^900 
c 80 -k 
r \ooo 

k= 0 C 80 






Z< 



10,5-8 

2.547 



= P[Z< 0.98] -0.8365 



P[X >10] = l-0.8365-0.1634. 

Observar que si no se hace correccion por continuidad se obtiene: 
P[X > 10] = 1 -P[ X < 10] = 1-P[Z< 0.79]= 1-0.7852=0.2148. 



7.3.1.3 Aproximacion de la Poisson a la normal 

Sean X ] , X n , n, variables aleatorias independientes e identicamente 

distribuidas como Poisson cada una con promedio X en un intervalo dado. Es decir 
en el misino intervalo cada X i , ocurre con media y varianza iguales a X. 
Entonces. para n suficientemente grande la variable: 

i= 1 

tiene distribucion de Poisson con media y varianzas iguales a nX . 

En consecuencia* por el teorema del limite central, la variable aleatoria: 

X -nX 

tiene aproximadamente distribucion /V(0,1), cuando n es suficientemente grande. 

La aproximacion es buena si nX> 5 

EJEMPLO 7.37 

El promedio del numero de accidentes de trabajo en una fabrica es 2 cada 
semana. Calcule la probabilidad de que se produzcan al menos 115 accidentes 
durante 50 semanas. 

SOLUCION 

Sea X ■ # de accidentes por semana con un promedio de X = 2. Entonces, 

50 

X = ^ X t , el numero de accidentes en 50 semanas. 

i=i 

tiene distribucion de Poisson con media y varianzas iguales a 
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nk = 50x2 = 100 , 

Por el teorema del li'mite central, la variable aleatoria: 

X -nX X -100 

tiene aproximadamente distribucion 7V( 0,1) 

P[X >\\5] = P[X >114.5] = P[Z> 1.45] = 0.0735. 



7.3.1.4 Aproximacion de la Chi-cuadrado a la normal 

Si la variable aleatoria X ~ x (O » entonces, para r suficientemente grande, la 
variable aleatoria y/2X tiene aproximadamente distribucion N^Jlr - l,l) En 
consecuencia, Z = V2^"--v/2r-l - 7V(0,1) , y 

P[X <a]= =p[z<V2a->/2r-l] = o(V2a— v/2r-l) 
el valor de se obtiene de la tabla de la distribucion normal. 

EJEMPLO 7.38 

a) Si X ~ x 2 (200) , calcular P[ 1 60 < X < 240] . 

b) Si X - x 2 (100) , calcular a tal que P[X < a] = 0.995 . 

SOLUCION. 

a) Si X ~ x 2 (200) , entonces, Z = -J2X --Jlx 200 - 1 ~ /V(0,1) . Luego 

/1160<X <240] = /lV2xl60->/399<Z<V2 x 240-V399] 

s P[-2.09 < Z < 1 .93] = 0.9732 - (1 - 0.98 17) = 0.9549. 

b) Si X ~ x 2 (100) , entonces, Z = -J2X — V2xl00 — 1 - 7V(0,1). Luego, 

0.995 = P[X < a] = P[Z < -Jla - -^2(100) -1] = P[Z <V2a -14.1 1] 
entonces, -Jla - 1 4. 1 1 = 2.575 , de donde resulta a = 1 39. 1 
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1. Se ha determinado que la vida util de cierta marca de llantas radiales tiene una 
media de 38,000 Km. y una desviacion estandar de 3,000 Km. Si una empresa 
de transporte adquiere 36 de estas llantas, ^cual es la probabilidad de que rindan 
al menos 1,318,500 km. en conjunto?. 

Rp. 0.9970 

2. El numero de ingresos a internet que ocurre diariamente en determinada 
computadora personal, es una variable aleatoria X con distribucion de 
probabilidades: 



X 


0 


2 


4 


P[X = x] 


0.125 


0.75 


0.125 



a) Determine la distribucion de probabilidades del numero de ingresos de 30 
dfas. 

b) Calcule la probabilidad de que ocurran entre 50 y 70 ingresos a internet en 
tal computadora en un periodo de 30 dfas 

Rp. p=2, cr=l,K 3 o=ZX, demanda 30 dias, a) }x£/V(60,30). b) / 5 [50<}'3o<70]=0.9328 (sin 

corregir). 

3. Suponga que en cierta region el ingreso mensual por familia en miles de dolares 
es una variable aleatoria X con funcion de densidad: 

f 0.25.x si 0 < x < 2 
[1-0.25* si 2 < jc < 4 

Considerando una muestra aleatoria de 100 ingresos 

a) ^Cual es la probabilidad de que el total de ingresos de la muestra supere los 
167 mil dolares?. 

b) Calcular aproximadamente la probabilidad de que mas de 20 ingresos de la 
muestra sean mayores que 3 mil dolares? 

Rp. E(X)= 2, V(*)=4-6667. a) Loo=ZX total de 100 ingresos. P[Yvx>> 167]=0.063. 
b) W:# de ingresos mayores 3 mil dolares, W~B( 100, p ), p~P[X>3]=0. 125, 
f 5 [U / >20]=£[Z>(20.5- 1 2.5)/3.307]= 0.0078. 

4. La demanda diaria de un producto es una variable aleatoria X con distribucion de 
probabilidad: 



JC 


1 


2 


3 


4 


5 


r\x-x\ 


1/10 


2/10 


3/10 


3/10 


1/10 



www.FreeLibros.me 



336 



Esiadistica 



a) ^Cual es la probabilidad de que la demanda de 30 dfas supere las 103 
unidades? 

b) Cada dia se ponen a la venta 4 unidades del producto. Cada unidad se 
compra a $5 y se vende $10 unidad. Cuando una unidad del producto no se 
vende durante el dia se descarta con una perdida adicional de $0.5, calcular 
la probabilidad de que la utilidad que se genere en 36 dfas supere los $495. 

Rp. p=3.1, cr=1.29,K3o=IX, demanda de 30 dfas, YyjzN(933$J), P[Y 3 o>I03]=0.0537 (sin 
corTegir). £/=Utilidades: -11.5, -1, 9.5, 20, 20, E(U)=9. 5, V{U)= 110.25, 
W suma de 36 utilidades, W^V(342, 63 2 ), P[W>495]= 0.0075. 

5. Se desea fabricar cables de fibras de nylon de manera que puedan resistir sin 
romperse al menos 466 Kg.. Si cada fibra tiene una resistencia media de 10 Kg., 
y una varianza de 0.75 kg 2 ., £,Con cuantas fibras se debe formar el cable de 
manera que cumpla las exigencias con probabilidad 0.99? 

Rp. /!=?/ P[y;>466]=0.99, £[Z>(466- 1 On )/(0.75 n ) l/2 ] =0.99. n= 48. 



6. Suponga que cada bolsa de cemento mezclado con arena y piedra chancada Uena 
en promedio 4 mts 2 de techo con una desviacion estandar de 1.1 mts 2 . 
Asumiendo independencia en el rendimiento de cada bolsa de cemento, si se va 
a Ilenar un techo de 188 mts 2 , ^cuantas bolsas de cemento como mini mo seran 
necesarias para que con probabilidad 0.85 se logre Ilenar el techo? 

Rp. «=? / P[ Y n > 1 88]=0.99, P[Z>{ 1 88-4«)/I . 1 («) 1/2 ]=0.85, ii=49. 



7. El tiempo que demora un operario en ensamblar un objeto es una variable 
aleatoria X, cuya distribucion tiene una media de 30 minutos y una desviacion 
estandar de 2 minutos. El objeto totalmente terminado requiere un tiempo de 
5+ X minutos. Si el operario tiene que entregar 36 objetos totalmente 

terminados, calcular la probabilidad de que utilice al menos 20.5 horas. 

Rp. 0.9938. 



8. El tiempo que demora una persona en hablar por telefono es una variable 
aleatoria con media de 3 minutos y una desviacion estandar de 0.5 minutos. Si el 
costo por llamada tiene un valor fijo de $0.8 mas un costo variable de $0.05 por 
minuto, calcular la probabilidad de que el costo al realizar 36 llamadas sea 
mayor que $85. 

Rp X tiempo, C: costo C=0.8 + 0.5A\ £( C)=2.3, V(C)=0.0625.: 
Y*:o osto 36 llamadas, K*s/V(82.2, 2.25), £[^>$85]= 0.0307 

9. Un supermercado produce un pan especial cuyo peso X debe tener una media de 

100 gramos y una desviacion estandar de 5 gramos. Si el pan tiene mas de 100 
gramos, el costo por la diferencia por cada pan en soles esta dado por 

C - 0.01 25 X -1.00 
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Si se producer 200 panes por turno, ^cual es la probabilidad de que el costo 
total por la diferencia supere los S/48? 

Rp. £(C>=0-25, V( 0=0.00391, el total de 200 costos. 

P[ ) / 2oo>48]=/ 3 [Z>(48-50)/0.8839]=0 9881 

10. ^Cual es la probabilidad de que en una muestra de 80 alumnos existan a Io mas 
dos con enfermedad E si se sabe que en toda la poblacion, 

el 70% son hombres 
el 30% son mujeres 

el 5% de los hombres padecen la enfermedad E 
el 2% de las mujeres padecen la enfermedad E? 

Rp. £(£)= 0.05x0.7+ 0 02x0.3= 0.041 . X:# de alumnos con enfermedad E de 80, 

80.0.04 1 ), F[X<2]=0.33 (0.2358 sin corregir). 

11. Un distribuidor recibe al mismo tiempo un lote grande de mercaderfa en cajas. 
El 60% proviene del proveedor A y el resto proviene del proveedor B. For 
experiencias anteriores se sabe que el porcentaje de cajas que contiene a lo mds 
una unidad defectuosa es 1% de A y 2% de B. Si del lote se escogen al azar 36 
cajas, ^,Cual es aproximadamente la probabilidad de que a lo mas dos de estas 
contengan a lo mas una unidad defectuosa? 

Rp p=0.01 x0.6+0.02x0.4=0.014, X: # de cajas que contienen una o mds unidades defectuosas, 

X~Bi36,py P[X < 2J=0.9977 (0.9830 sin corregir).. 

12 . a) Un sistema esta formado por 100 componentes que funcionan 

independientemente. La probabilidad de que cualquier componente falle 
durante el periodo de operation es 0.1. El sistema funciona si al menos 80 
componentes funcionan. Calcular la probabilidad de que el sistema funcione. 
b) Suponga que el sistema anterior esta formado por n componentes, cada una con 
probabilidad de funcionamiento de 0.9. El sistema funciona si al menos el 80% 
de las componentes funcionan Determine el valor de n de modo que el sistema 
funcione con probabilidad 0.9772. 

Rp. Exito Componente funciona, a) X: # exitos de 100, X~B( 100, 0.9), £[X>80]=0.9998, 
b) X : # exitos de w. X~B(n, 0.9), P[XM > 0.8]s0.9772. /i=36 



13 . Una compafifa hotelera observa que el 12%? de habitaciones reservadas no son 
cubiertas. La compama decide aceptar reservas por un 10% mas de las 450 
habitaciones que dispone. Calcular aproximadamente el porcentaje de clientes 
con reservas que se quedaran sin habitation. 

Rp. X :# habitaciones reservadas cubiertas de /i=495 (450 + 10%(450), X~B(495, 0.88), 

£[X>450]=0.0197. 

14 . Cincuenta alumnos haran uso de las computadoras del laboratorio de computo. 
Se ha estimado que cada alumno usara una computadora el tiempo promedio de 
36 minutos por hora solicitada, ^cudntas computadoras deberia tener el 
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laboratorio de tal manera que en cualquier instante el numero de computadoras 
sea insuficiente con probabilidad 0.0217?. 

Rp. Sea it el # de computadoras. X: # de alumnos de /i=50 que usaran las computadoras, X~B{ 50.0.6). 
p= 0.6 (36 minutos de 60). El numero de computadoras es insufiaente si X>k. P[X>k)=0.G2\l , k=31. 

15 . Un artfculo electrico tiene una duracion promedio de 800 horas. Tambien se 
sabe que dicha duracion es una variable aleatoria que tiene distribucion 
exponencial. El costo de fabricar el artfculo es de S/.200. El fabricante vende el 
artfculo a S/.500 pero garantiza la devolucion total del dinero si dura menos de 
1000 horas. 

a) ^Cual es la utilidad esperada del artfculo? 

b) De 200 artfculos, ^cual es la probabilidad de que mas del 65% sean 
devueltos con garantfa?, 

Rp. a) E(U)~-200(\ -e ,(V V 300e~ 1(V8 =-56.75 , b) X-fl^OO, p), P[X>130]=0.9767. 

16 . El costo de la produccidn de cierto artfculo tiene una media de $8 y una 
desviacion estandar de 1$. Si se adquicren 36 de tales artfculos para su 
comercializacion, hallar cl valor de la venta K de cada uno de ellos de manera 
que al vender los 36 se quiere ganar al menos $98. 1 3 eon probabilidad 0.95. 

Rp K=\n. 

17 . Un dado se lanza 300 veces. Calcular la probabilidad de que el numero de veecs 
que se obtiene el 4 difiera del numero de veces que se espera el 4 en mas de 12. 

Rp P[|X-£(20|> 121=0.0524 (0.0628 sin corregir) 

18 . Una maquina es dada de baja para ser reparada, si una muestra aleatoria de 100 
artfculos de su produccion da por lo menos 2% de artfculos defectuosos. 
Calcular la probabilidad de que la maquina sea dada de baja si realmente 
produce el 2% de artfculos defectuosos. 

Rp / 3 [X>2//?-0.02]-0.6406 (0.5000 sin corregir). 

19 . Un fabricante de cierta medicina sostiene que esta cura cierta enfermedad en el 
90% de los casos. Para veriftcar tal afirmacion se utiliza el medicamento en una 
muestra de 100 pacientes con esa enfermedad y se decide aceptar la afirmacion 
si se curan 80 o mas, en caso contrario se rechaza. 

a) ^Cual es la probabilidad de aceptar la afirmacion cuando la probabilidad de 
curacion sea 0.80?. 

b) £,Cu£l es la probabilidad de rechazar la afirmacion cuando la probabilidad de 
curacion sea 0.90?. 

Rp, a) 0.5498 (sin corrector: 0.5000), b) 0.0002 (sin corrector 0.0001 ) 



20 . Para controlar la calidad de un proceso de produccion de cierto tipo de objetos, 
cada vez se selecciona una muestra aleatoria de tamano 40 uno por uno sin 
reposition. Si el numero de objetos defectuosos en ia muestra es al menos k se 
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detiene el proceso, en caso contrario se continua. Calcular el valor de k para que 
con probabilidad (corregida) de 0.0351 no se continue con el proceso cuando la 
production total contenga 5% de objetos defectuosos. Rp. k = 5. 

21. Un transbordador transporta 300 pasajeros. Se sabe que el peso de la poblacion 
de pasajeros tiene una media de 63 kgs. y una varianza de 135 kgs“ y que el 
30% de toda la poblacion dc pasajeros tiene pesos que superan los 90 kgs. 

a) Si el reglamento de seguridad establece que el peso total de los pasajeros del 
transbordador no debe exceder los 1 9000 kgs en mas del 5% de las veces. ^Cumple 
el transbordador las reglamentaciones de seguridad?. 

b) Si la poblacion consiste de 2000 pasajeros, ^que probabilidad hay de que menos del 
25% de los 300 pasajeros tengan un peso que supere los 90 kilogramos 9 

Rp. a) Yw i)~ M 1 8900. (20I.246) 2 ). P[ Eoo>I9000]=/4Z>( 19000-1 8900 )/20 1.246)= P[Z>050] =0.309 
No cumple. b) X~H( 2000. 600,300), P[X<74]=/>[Z<<74.5-90)/7.3 1961-0 0170 

22. Suponga que el 20% de las llamadas telefonicas dc un vendedor resultan en 
ventas. Halle la probabilidad de que sean necesarias efectuar al menos 140 
llamadas para que resulten 40 ventas. 

Rp X: # llamadas hasta tener 40 ventas. E(X)=r/p=4lV(0.2)=2Q0. 

Vf A>=/t£///7 : >=40[0.8/( 0 .2 ) 2 1 =800 / > fX>I40]- 0.9838. 

23. En un rfo de la selva donde existen muchos tipos de peces, se sabe que el 40% 
de ellos son de la especie E Si los peces se pescan uno por uno. C cual es la 
probabilidad de que sean necesarios pescar mas de 60 peces para obtener 36 de 
la especie E? 

Rp. X: # mtentos hasta obtener 36 de especie E. £'{>0= : 36/(0.4)=90, V'(X;=36[0.6/(O.4) 2 ]= 1 35. 

P[X>60]=0.9945. 

24. El monto de las compras diarias de los clientes de la tienda P&C que 
adquirieron una tarjeta de credito especial tiene una media de 250 soles y una 
desviacion estandar de 60 soles. Ademas el 12.5% de todos los clientes compra 
por mas de $300. 

a) El gerente de ventas de esta tienda afirma que el total de compras diarias de los 
primeros 36 clientes con tarjeta de credito especial supera los 10,000 soles en mas 
del 5% de las veces. [Es correcta la afirmacion del Gerente? 

b) Si la poblacion consiste de 400 clientes de la tienda que tienen la tarjeta de credito 
especial iQue probabilidad hay de que al menos el 25% de 36 de estos clientes 
escogidos al azar compren por mas de 300 soles? 

Rp. a) Y%=N(9000.(360) 2 ) P[Kv>>10000]=P[Z>2.78]=0.0027. 

b) H(400.50,36), c) Z=(X-4.5)/ 1.8952. P[X>9]=P[Z>2.37]=0.0089 

25. El promedio del numero de accidentes de trabajo en una fabrica es 1 cada 
semana. 

a) Si acaba de ocurrir un accidente, ^,cual es la probabilidad de que transcurra 
hasta 2 semanas antes de que ocurra otro accidente? 
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b) Calcular la probabilidad de que se produzcan mas de 45 accidentes durante 
36 semanas. 

Rp. a) X: Poisson, X=l, b) 7: Exponential con P=X=I. P[X<21=l-e \ 
b)P[X>45]=P[Z>(45.5-36xl )/6] =0.0571 

26. Una empresa produce laminas de acero de 4 metros. El numero de defectos que 
se encuentra al desenrollar las laminas es una variable aleatoria de Poisson que 
tiene una media de 2 defectos por lamina. ^Cual la probabilidad de que, se 
encuentren a lo mas 50 defectos al desenrollar 32 rollos de lamina?. 

Rp. X=2, P[X<50]=P[Z<(50.5-32x2)/8J -0.9545 

27. La vida de un chip es una variable aleatoria que tiene distribucion exponeneial 
con pardmetro 1/0. 

a) Calcule el porcentaje de chips que funcionan al menos el tiempo promedio. 

b) Determine la probabilidad aproximada de que el tiempo de vida util total 
de 36 chips sea superior a 480 

Rp. a) £(X)=0. P[X>ei=e-'. b) P[Y v >480)=P[Z>(480-30)/60]==P[Z>2]=O.O228 

28. Una maquina llena vasos de refrescos de 8 onzas El numero de onzas por vaso 
tiene una distribucion normal con una media de 7.8 onzas y con una desviaeion 
estandar de 0.8^ onzas. *.Que probabilidad hay de que al llenar 100 vasos de 8 
onzas el lfquido total derramado sea mayor de.6 onzas? 

Rp. X-M7.8, (0.8) 2 ), Yntr M780.8 2 ). b) P[Pino>806]=P[Z>(806-780)/8]=P[Z>3.25]=0.0006. 

29. El tiempo de funcionamiento de un determinado tipo de batcrfa es una variable 
aleatoria con distribucion gamma de media 5 semanas y desviaeion estandar 1.5 
semanas. En cuanto la bateria deja de funcionar se reemplaza por otra nueva con 
las mismas caractensticas. 

a) Justificando debidamente, determine la probabilidad aproximada de que en 
cinco anos (52 semanas por aho) no hayan sido suficiente 50 baterfas. 

b) iCon cuantas baterfas se asegura que el tiempo total de funcionamiento es al 

menos 162 semanas con probabilidad 0.9772? 

Rp. a) Tspfiinc. 50 baterfas , Pm^V(50x 5, 50 x(1.5) 2 ), P[7W52x5]=P[Z<0.9428]=0.8264. 

b) nil P[T» >I62]=0 9772, #i=36 

30. El departamento de creditos de la tienda comercial “TOP y TOP” sabe que el 
30% de sus ventas son pagadas con dinero en efectivo, 30% con cheque y el 
40% al credito. La probabilidad de que una venta sea por mas de $50 es igual a 
0.2 si esta es en efectivo, es igual a 0.9 si esta es con cheque y es igual a 0.6 si 
esta es al credito. Un investigador escoge una muestra aleatoria de 256 clientes 
que acaban de comprar en esa tienda,. Halle la probabilidad de que menos de 
126 clientes de la muestra hayan comprado por mas de $50 

Rp. p=0.3x0.2+0.3x0.9+0.4x0.6=0.57, X~B(250. /?), PfX<I25]=P[Z<-2.58]=0.0049 
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DISTRIBUCIONES MUESTRALES 
8.1 Muestreo aleatorio 



8.1.1 Poblacion y parametros 

Definicion. Se denomina poblacion o universo a la totalidad de personas u 
objetos que tienen una o mas caracterfsticas medibles o contables de naturaleza 
cualitativa o cuantitativa. 

La caracterfstica medible o contable es una variable estadistica cuyo valor, 
numerico o no numerico, es una observacidn. 

Si la variable estadistica a estudiar es una sola, cada elemento de la poblacion 
puede asociarse con una observacidn. En este sentido, se denomina poblacion al 
conjunto de valores posibles de la variable. 

Si los elementos de la poblacion se definen en forma aleatoria, entonces la 
variable estadistica cuantitativa es una variable aleatoria cuyos valores constituyen 
la poblacion. En este caso. la distribucion de la poblacion es la distribucion de la 
variable aleatoria, por lo tanto, la media y la varianza de la variable aleatoria, 
vienen a ser la media y la varianza de la poblacion. 

Si la variable aleatoria X tiene distribucion fix), se puede referir a la poblacion 
fix), Por ejemplo, si X esta normalmente distribuida se dice que la poblacion esta 
normalmente distribuida o que se tiene una poblacion normal. 

Por el numero de observaciones la poblacion puede ser finita de tamano N, o 
infinita. Algunas poblaciones finitas son tan grandes que en teorfa son asumidas 
como poblaciones infinitas. 

Definicion. Se denominan parametros a las medidas descriptivas que caractenzan 
a la distribucion de la poblacion. Entre otros, los parametros poblacionales son. 
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Media : p 

Proportion : n o p 

2 

Varianza : G 

Desviacion estandar : ct 

En diversas aplicaciones estadisticas al estudiar una poblacion, la variable 
aleatoria que la define puede tener distribution conocida o no. La distribution de 
la poblacion es conocida, si se conocen sus parametros y su forma, es decir si se 
conoce su distribution de probabilidad . 

Si la distribution de la poblacion es desconocida, podemos estar interesados en: 

* Estimar sus parametros, si se conoce su distribution, y 

* Probar determinada suposicion acerca de un valor determmado del 
parametro, o probar la suposicion acerca del tipo de distribucion de 
probabilidades de la poblacion. 

8.1.2 Muestra aleatoria 

En vez de examinar la poblacion entera, lo cual puede resultar fisicamente 
imposible o no practica, puede examinarse una muestra de la poblacion con el 
proposito de inferir los resultados encontrados. 

Una muestra es un subconjunto de la poblacion. 

El proceso de seleccion de una muestra de n elementos de la poblacion se 
llama muestreo. Las ventajas y las razones para el muestreo son diversas, las 
mismas que no explicaremos en este texto. 

El proceso que consiste en inferir resultados a la poblacion a partir de la muestra 
>e denomina inferencia estadistica. La confiabilidad de las conclusiones extraidas 
concernientes a una poblacion dependen de si la muestra se ha escogido 
apropiadamente de manera que represente bien a la poblacion. 

Una tecnica para obtener muestras representativas de la poblacion es el muestreo 
aleatorio. Se llama muestreo aleatorio a todo proceso que asegure en cualquier 
momento del mismo igual probabilidad de ser incluidos en la muestra a todos los 
elementos que pertenezcan a la poblacion en dicho momento. 

A las muestras aleatorias se les denomina tambien muestras probabilfsticas 
Las muestras aleatorias son de 4 tipos: Al azar simple, al azar sistematico, 
estratificado y por grupos (o conglomerados). 

Muestra al azar simple 

Es aquella en la que los elementos se escogen del total de la poblacion en forma 
individual con una oportunidad igual e independiente .Por lo general se utiliza una 
tabla de numeros aleatorios. 

Si la poblacion es infinita el muestreo aleatorio ocurre cuando la extraction de 
los elementos de la muestra se hace con o sin rcemplazo. Si la poblacion es finita 
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de tamano /V, el muestreo aleatorio ocurre tambien si la extraccion es con o sin 
reemplazo. Con reemplazo, la probabilidad de cada elemento de ser extraido es 
1/N. Si es sin reemplazo, la probabilidad de cada elemento de ser elegido es 1/N en 
la pnmera extraccion, es de 1 /(N— 1 j en la segunda extraccion, es I /(N— 2) en la 
tercera extraccion, etc. 

Por ejemplo, seleccionar una muestra al azar simple es similar a la que se 
realiza en la extraccion aleatoria de numeros en una loteria. 



Muestra al azar sistematica 

Una muestra aleatoria sistematica es aquella en que sus elementos se eligen de 
la poblacion a intervalos uniformes a partir de un listado ordenado. El £-esimo 
elemento de la muestra es k=N/n , donde n es el tamano de la muestra y N el tamano 
de la poblacion. 

Por ejemplo, al elegir una muestra sistematica de 100 alumnos de EE.GG.CC 
que tiene 3000 alumnos, k =3000/100 =30. El primero se elige en forma aleatoria de 
los 30 primeros de la lista y los demas sistematicamente cada 30 alumnos de la 
lista. 

Muestreo aleatorio estratificado 

Primero se clasifican a los elementos de la poblacion en subgrupos separados 
de acuerdo con una o mas caracterfslicas importantes (estratos). Despues se obtiene 
por separado una muestra aleatoria simple o sistematica en cada estrato. El tamano 
de cada submuestra debe ser proporcional al tamano del estrato para asegurar 
representati v idad . 

Por ejemplo, para obtener una muestra aleatoria de 600 electores de una poblacion 
de 600,000 electores de los cuales 300,0000 son de clase baja, 200,000 de clase media 
y 100,000 de clase alta. Se deben elegir al azar 300 de clase baja, 200 de clase media y 
lOOde clase alta. 

Muestreo aleatorio agrupado 

Denominado tambien por conglomerados. Los elementos de la poblacion se 
dividen en forma natural en subgrupos Luego se eligen al azar los subgrupos que 
forman la muestra. 

Por ejemplo, al estudiar los pensiones que se pagan en los colegios particulars 
donde no es posible tener una lista de todas las pensiones, pero puede obtenerse una 
lista de los colegios particulars (grupos). Entonces, con esta lista puede obtener 
una muestra aleatoria de colegios y asi obtener los pensiones que se pagan en estos 
colegios. 

El muestreo aleatorio simple, es pues el proceso de selection de una muestra 
por el cual cada uno de los elementos de la poblacion tienen una oportunidad igual 
e independiente de ser incluidos en la muestra. En el muestreo aleatorio simple cada 
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variable aleatoria X,* cuyo valor es jc £ -, tiene la misma distribucion de la poblacion de 

la cual se obtiene. Por ejemplo, supongamos que una poblacion consiste de 8 fichas, 
dos con el numero 2, cuatro con el numero 5, y dos con el numero 7. Si se extrae 
una ficha al azar, la ficha puede tomar cualquiera de los tres valores: 2 con 
probabiiidad 0.25, 5 con probabilidad 0.50, y 7 con probabilidad 0.25, que viene a 
ser la misma distribucion de la poblacion. 

Luego, diremos que los valores x lt x 2 ,...x n tornados respectivamente por las 
variables aleatorias X 1 ,X 2 ,...,X„ , constituyen una muestra aleatoria simple de 
tamano n de una poblacion f[x) de la variable aleatoria X, si estas variables 
aleatorias estan distribuidas en forma identica a la distribucion de la poblacion y 
son independientes. Llamaremos tambien muestra aleatoria simple a este conjunto 
de variables aleatorias. Formalmente definimos una muestra aleatoria simple o 
brevemente muestra aleatoria de la forma siguiente: 

Definicion. (muestra aleatoria simple). Dada una poblacion f(x ) con media p y 
vananza a 2 , se denomina muestra aleatoria de tamano n de esa poblacion, a un 
conjunto de n variables aleatorias X lf X 2 ,...,X n tales que: 

1) Son independientes. 

2) Cada una de ellas esta distribuida en forma identica a f(x). 

La condicion 1) implica que la distribucion de probabilidad conjunta de la 
muestra aleatoria X, , X 2 ,..., X n es la expresion: 

/t*i . x 2 ,...,x n ) = /(*, )f(x 2 ).../(*„ ) 

La condicion 2) significa que: 

a) Cada variable aleatoria Xj tiene la misma media y varianza de la distribucion 

deX, esdecir: £(X ( ) = |a y Var(X i ) = cr 2 

b) La distribucion de probabilidad de cada variable aleatoria X i es la misma 
distribucion de probabilidades de X, esto es, /( x t ) = fix) 

NOTA. El proceso de obtener este tipo de muestra requiere poblacion infinita o 
bien poblacion finita pero con reposicion de elementos. 

EJEMPLO 8.1. 

Sea X,,X 2 ,..., X n una muestra aleatoria de tamano n de una poblacion normal 
7V(H, cr 2 ) 

a) Escribir la funcion de densidad de probabilidad conjunta de la muestra. 

b) Si n = 6, p = 20 , y o 2 = 25, calcular la probabilidad de que: 
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bl) Xj + X 3 +X 4 -X 6 sea mayor que 52. 
b2) al menos una de las sea me nor que 29.8, 

SOLUCION. 



a) La funcion de densidad conjunta de la muestra aleatoria es 

/(•> h’ X 2 — *n ) = /(*1 )/(* 2 )•••/(*„ ) = [/U, )]" 



f(X t .X j.... ) = 



a V2 7i 






A 2 V w /2 

^2 7ia J * 



IS (“)■ 



bl) La media y la varianza de la variable aleatoria Y = Xj + X 3 + X 4 - X 6 estan 
dadas respectivamente por: 

e(y) = e(x, )+ £(x 3 )+ £(x 4 )- f(x 6 ) = 20 + 20+ 20- 20 = 40. 

V(y) = v(x, ) + v(x 3 )+ v(x 4 ) + V(X 6 ) = 25 + 25 + 25 + 25 = 1 00. 

Por la propiedad reproductiva de la normal la variable aleatoria Y tiene 
distribucirin normal /V(40,100), luego, la variable aleatoria estandar: 

Y-iiy Y - 40 

Z = = 1 tiene distribucion /V(0,1), y 



10 



P[Y >52] = P 
b2) Sea ahora la variable aleatoria 

Y: = 



10 



L -40 52-40 

> 



10 



j = £[Z > 1.2] = 0. 



1151. 



1. si X, < 29.8 
0, si X, >29.8’ 



Entonces, Y i es Bernoulli B{ 1, p ) , donde p = P[Y I = 1] . la probabilidad del 
exito es igual a: 



P = P[X 



, < 29.8] = 



-20 29.8-20 

< 



= P[Z < 1 96] - 0.975. 
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6 

En consecuencia, la variable aleatoria. Y = ^ Y t es binomial B(6, p) , esto es, 

i=i 

P[K = y] = C*p r (l-p) 6_v , >- = 0,I,2,3, 4,5,6, 

Por tanto, la probabilidad de que al me nos un X z , sea menor que 29.8 es: 

P[Y > 1] = 1 - P[Y = 0] = 1 - (0.025) 6 = 1 - 0.000 = 1 .000. 



8.1.3 Estadisticas 

Definition. Se denormna estadistica a cualquier funcidn de las variables aleatorias 
que constituyen la muestra. 

Una estadistica es una variable aleatoria Y - H(X } , X n ) , cuyo valor es 

el numero real y - H(x x ,* 2 ). El termino estadistica se usa para referirse 

tanto a la funcion de la muestra, como al valor de esta funcion. 

En general para cada parametro poblacional hay una estadistica correspondiente 
a calcularse a panir de la muestra. Algunas estadisticas importantes y sus valores 
calculados a partir de una muestra aleatoria son: 



a) La media muestral X = — , con valor: x = — ^ x { . 



"7=i 



/=! 



1 n _ i n 

b) La varianza muestral S 2 ^(X i -X ) 2 , con valor: s 2 =— ^ (jt, -x) 2 . 

n * "" ^ n 



c) La desviacidn estandar muestral S 






— 1 x- 

d) La proporcion muestral (porcentaje de exitos en la muestra) P o P = — > X t . 

n »=i 

donde X i ~ fl(l, p) (el parametro p es el porcentaje de exitos en la poblacion) 
Tambien, 



— X 

P = — , donde X ~ B(n , p) 
n 

El valor de P (o P ), calculada a partir de una muestra, se denota por p (o p ). 
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8.2 Distribuciones muestrales 



Definition. Se denomina distribution muestral de una estadistica a su 
distribution de probabilids-J 

Por ejemplo, a la distribucidn de probabilidad de la estadfstica media X , se le 
denomina distribucion muestral de la media. 



8.2 .1 Distribucion muestral de la media X 

TEOREMA 8.1. Sea X , , X n , una muestra aleatoria de tamano n escogida 



c) Para n suficientemente grande, la variable aleatoria, 




tiene distribucion aproximadamente normal N( 0 , 1 ). 

PRUEBA. 

Por la definition de muestra aleatoria, las variables aleatorias X,, X-,,.... X n , son 
independientes e identicamente distribuidas como fix ) con £(X ( )-p, y con 

Var( X f - ) = o “ . Entonces, 



de una poblacion fix) con media 1 1 y con varianza a 2 . Si X es la media 
muestral , entonces. 




n 





V" i=i j w i=i 



a 



n 



2 



c) Se deduce del teorema del lfmite central escribiendo 



n 
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NOTAS. 

1. La aproximacion de X a la normal N([i y G 2 /n) es buena si /z>30, sin 
importar si la poblacidn es discreta o continua. 

2. Si la muestra aleatoria es escogida de una poblacidn normal /V(p,c 2 ), 
entonces, la distribucion de X es exactamente normal 7V(p, a 2 /n) % para 
cualquier tamano de muestra, n > 2 . 

— a 2 

3. La varianza de la media: Var(X)- es valida, si el muestreo es con o sin 

n 

reemplazo en una poblacion infinita, o es con reemplazo en una poblacion finita 
de tamano N. 

Si el muestreo es sin reemplazo en una poblacion finita de tamano N, entonces, 
la varianza de la distribucion de X es: 




N-\ j 



N - n 

El coeficiente se denomina factor de correccion para poblacion 

N - 1 

finita. Observar que cuando N -> +oo el factor de correccion tiende a uno, 

4. La desviacidn estdndar de una estadistica es conocida como error estandar 



EJEMPLO 8.2, 

Suponga que una poblacion finita X consiste de los valores: 

3, 4, 7, 9, 12. 

a) Calcular la media y la varianza de la poblacion. 

b) Determinar la distnbucidn muestral de la media de las muestras de tamano dos 
escogidas con reposicion. 

c) Determinar la distribucidn muestral de la media de las muestras de tamano dos 
escogidas sin reposicion. 

d) Si se extraen muestras al azar de tamano 36 con reposicion, ^cu£l es la 
probabilidad de que la media muestral este entre los valores 5 y 8? 

SOLUCION. 

a) La distribucidn de probabilidad de esta poblacidn finita de tamano N= 5, es la 
distribucion uniforme siguiente: 
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*1 


3 


4 


7 


9 


12 


fix k ) = P[X = x>] 


1/5 


1/5 


1/5 


1/5 


1/5 



La media y la varianza de la poblacion son respectivamente: 



‘ 4 ^ fe--^'- 3+4+7t9+ ' 2 



i=l 



i=l 



N N 



= 7. 



* E * 2 

— n 2 = 



— + 4 2 + 7 2 + 9 2 + 12 2 _ ]08 



b) Se pueden extraer 5 x 5 = 25 muestras de tamano dos con reposicion. Las 
muestras y sus medias son las siguientes. 



3,3 


3,4 


Muestras 

3,7 


3,9 


3, 12 


3 


Medias de las muestras 

3.5 5 6 7.5 


4,3 


4,4 


4,7 


4,9 


4, 12 


3.5 


4 


5.5 


6.5 8 


7,3 


7 ,4 


7 ,7 


7,9 


7,12 


5 


5.5 


7 


8 9.5 


9,3 


9,4 


9,7 


9,9 


9, 12 


6 


6.5 


8 


9 10.5 


12,3 


12,4 


12,7 


12,9 


12, 12 


7.5 


8 


9.5 


10.5 12 



La distribucion de probabilidades de las medias es: 



X 


3 


3.5 


4 


5 


5.5 


6 


65 


7 


7.5 


8 


9 


9.5 


10.5 


12 


/( X) 


1/25 


2/25 


1/25 


2/25 


2/25 


2/25 


2/25 


1/25 


2/25 


4/25 


1/25 


2/25 


2/25 


1/25 



Luego, 



H x = E(X ) = 2 /<*>* = 1 75/25 = 7. 

= Var(X ) = (x)x 2 ~[i 2 = ~ 7 2 =5.4 



Observar tambien que : 




10.8 

2 



5.4. 



c) Se pueden extraer 5 x 4 = 20 muestras de tamano 2 sin reposicion. 



Las muestras y sus medias respectivas son las siguientes: 
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Muestras 



3,4 


3,7 


3,9 


3 , 12 


4,3 


4,7 


4,9 


4 , 12 


7,3 


7,4 


7,9 


7 , 12 


9,3 


9,4 


9,7 


9 , 12 


12,3 


12,4 


12,7 


12,9 



Medias de las muestras 



3.5 


5 


6 


7.5 


3.5 


5.5 


6.5 


8 


5 


5.5 


8 


9.5 


6 


6.5 


8 


10.5 


7.5 


8 


9.5 


10.5 



La distribucion de probabilidades de la media es: 



X 


3.5 


5 


5.5 


6 


6.5 


7.5 


8 


9.5 


10.5 


fix) 


2/20 


2/20 


2/20 


2/20 


2/20 


2/20 


4/20 


2/20 


2/20 



Luego, 



= E(X) = ]T/(I)I = 140/20 = 7. 

ct | =Var(X) = Y J f(*)x 2 ~\x 2 = ^ 



1061 -7 2 =4.05. 



Observar tambien que: 



d) Sea X la media de las muestras de tamano n — 36 con reposicidn. La estadistica 
X tiene media y varianza respectivas: 



sh 




I 10.8 


f 5-2 ') 


n 1 


U-iJ 


2 


1 5 - 1 J 



o£(A r ) = p x =7, y o Var(X) = ^-- 



10.8 

36 



= 0.3 



El error estindar de X , es = yfo3 = 0.55 
Entonces, la variable estandar. 



Z = 



x -P x X -7 
CJ7T ~ 0.55 



tiene distribucion aproximadamente normal N(0,1). Por tanto. 



P[5<A: <8] = P 



5-7 < < 8 - 7 



0.55 0.55 0.55 



= P[-3.64 < Z < 1 .82] = 0.9655. 
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EJEMPLO 8.3. 

El numero de automoviles por familia en una ciudad es una variable aleatoria X 
cuya distribucion de probabilidad es como sigue: 



X 


0 


1 


2 


3 


4 


M 


4/12 


4/12 


2/12 


1/12 


1/12 



si se escoge al azar una muestra de 49 familias, ^cudl es la probabilidad de que la 
media muestral de autos por familia este entre 1 y 21. 

SOLUCION. 

La media y la varianza de X son respectivamente: 

M x = £(X ) = I *//(*«> = °<^> + + 2(L) + 3(-L) + 4 (^) = 1 .25. 

a x =f(x 2 )-( Mx ) 2 =^x, 2 /(x,)-(n x ) 2 =3.08 — (1 .25) 2 =1.52. 

Sea X la media del numero de automoviles en muestras de 49 familias. La 
estadfstica X tiene distribucion aproximadamente normal con media y varianza 
respectiva s: 

o E(X) = |a x =1.25 
2 i co 

o Var(X) = ^- = -^— = 0.031. 
x n 49 



El error estandar de la media X , es O; = Vf) 03 1 = 0. 1 76 
Entonces, la variable estandar, 



z x -H x X -1.25 
0.176 

tiene distribucion aproximadamente normal N(0,1 ). Por tanto. 



P[1<X <2]=P 



1-1.25 

0.176 



<Z< 



2-1.25 

0.176 



= Pl-1.42 < Z < 4.26] = 0.9222. 



EJEMPLO 8.4 

Un auditor toma una muestra aleatoria de tamano n = 100 de un conjunto de 
500 cuentas por cobrar. El auditor sabe que las 500 cuentas por cobrar constituyen 
una poblacion finita cuya desviacidn estandar es c = $145. ^Cual es la probabilidad 
de que la media muestral difiera de la media poblacional en mas de $26? 
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SOLUCION. 

Sea X la media de la muestra de tamano « = 100 escogida de la poblacion finita 
de N =500casos. Entonces, la variable aleatoria X tiene distribution 
aproximadamente normal con media = p, y error estandar: 



tiene distribucidn normal /V(0,1). La probabilidad de que la media muestral difiera 
de la media poblacional en m£s de $26 es: 



EJEMPLO 8.5. 

Una maquina empaqueta un determinado producto, en paquetes cuyo peso, en 
gramos, se distribuye normalmente con una desviacion estandar de 20 gramos y 
con una media p que debe ser bien regulada. 

a) La media p esta bien regulada si solo el 1% de los pesos de todos los paquetes 
que produce la maquina tienen pesos mayores a 546.6 gramos, ^cuanto vale p?. 

b) Con la media bien regulada, se programa el siguiente control del peso del 
producto: Cada hora se escogen al azar 4 paquetes, si el promedio de los pesos 
no estd entre 480 y 520 gramos, se para la mdquina para mantenimiento. En 
caso contrario se continua con el proceso. ^Cual es la probabilidad de parar la 
maquina cuando realmente esta bien regulada? 

c) Si la maquina esta bien regulada, <con que tamano de muestra se consigue que la 

media muestral sea a lo mas 490.2 gramos con probabilidad igual a 0.025? 




En consecuencia, la variable aleatoria estandar: 



X-n 

Of 12.982 




SOLUCION. 



Sea X el peso del producto empaquetado por la maquina, X ~ N(p,20 2 ). 
a) Se debe calcular p tal que P[ X > 546.6] = 0.0 1 



0.01 = P[X > 546.6] = P Z> 
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de donde resulta: 



546.6 - p 



= 2.33, y p = 500. 



b) Sea X la media de la muestra de tamano n- 4 . Por la propiedad reproductiva 
de la normal la variable aleatoria X tiene distribution exactamente normal con 
media p^- = 500 y error estandar: 

= v/Jn = 20/V4 = 10. 

Entonces, la variable aleatoria estandar: 

^ X-\x X-500 
a/^~ 10 

tiene distribucion normal N( 0,1). La probabilidad de no parar la maquina 
cuando realmente esta bien regulada es 



P[480 < X < 520/ p = 500] = P 



480-500 „ 520-500 

<Z < 



10 10 
= P[-2<Z< 2] =0.9544. 

Luego, la probabilidad de parar la mdquina es: 1- 0.9544=0.0456. 

c) Sea X n la media de la muestra de tamano n. Entonces, la distribucion de X es 

normal con media igual a 500, y error estdndar igual a 20 1 yfn . Se debe 
calcular n tal que P[X n <490.2] = 0.0250. Entonces, 

490.2-500 



0.0250 = P[X n <490.2 ] = P 
De donde resulta. 



Z< 



20 / yfn 



-9.8 

20 



Vn=- 1.96 

■Jn = 4 
n = 16 
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8.2.2 Distribution muestral de la proportion 

Sea X, ,X 2 ,...,X n una muestra aleatoria de tamano n extraida de la poblacion 
de Bernoulli B (\ , p), donde p es el porcentaje de exitos en la poblacion y sea 

- x l+ x 2 +...x n X 

n n 

la proportion de exitos en la muestra, siendo, X = X, + X 2 + --- + X n una 
variable binomial B(n , p) , entonces. 



a) Pp =£’(P) 



-E(X)= — (np) = p. 
n 



n #r n 



b) c^=V(/>) = y 

c) Si n es sufic ientemente grande, entonces la variable aleatoria: 

■fpO- ~P)Jn 

tiene aproximadamente distribucion 7V(0,1). 



NOTAS. 

1. El error estandar de P es: 



„ (To 1 

F \ n 



P ) 



2. Si la poblacion es finita de tamano /V y el muestreo es sin reposition el error 
estandar (desviacion estandar de la hipergeometrica) es: 



__ _ /p(l-p) \ N -n 

p V n v N-l ‘ 



Observar que si N es grande con respecto a n el factor de correction 
aproxima a la unidad. 



N-n 
N - 1 



se 



3. Si n es suficientemente grande ( n > 30) 
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p[p<c]=P Z<^ 

a 77 






Sin embargo aproximaciones satisfactorias se obtienen si se introduce el factor 
de correction por continuidad — . Luego, 



donde X es binomial y P es el porcentaje de exitos en la muestra, tienen 
distribution /V(0,1). 

EJEMPLO 8 . 6 . 

En un proceso de production el porcentaje de unidades defectuosas producidas 

es 4%. Para controlar el proceso, se revisan periodicamente los objetos producidos. 

a) Calcular aproximadamente la probabilidad de que en una muestra aleatoria de 
150 unidades revisadas se encuentren 6% defectuosos. 

b) Si el proceso de produccion se para al encontrar al menos 5% de unidades 
producidas al revisar muestras aleatorias de 100 objetos cada vez, £cual es la 
probabilidad de que el proceso continue si realmente produce 69c defectuosos 
del total de la produccion? 

SOLUCION 

a) Sea P -X/ 150, la proportion de articulos defectuosos en la muestra de 150 
unidades, donde X , el numero de unidades defectuosos en la muestra de 150 
unidades es Z?(150, 0.04) . 

Si se utiliza el modelo exacto para ejecutar el calculo, se tiene: 



Si se utiliza el modelo aproximado para ejecutar el calculo, aproximando a la 
normal por el teorema central del limite, se tienen 2 procesos: 

Un metodo, es utilizar la aproximacion binomial a la normal: 



2 n 




p 



4. Observar que las dos expresiones de Z 

P-p 





150 150 
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P[P =0.06] = F\X = 9] = P[8.5 < X <9.5] 



8.5-150(0.04) „ Xj^np c 9.5-150(0.04) 

[^/l 50(0,04)(0.96) ~ yjnp(l- p) J\50(0M)(0.96) 

= < z < = Pf 1 .04 < z < 1 .46] = °.° 77 1 

El otro metodo, es usar la propia distribution muestral de la proportion: 

= 0.06] = p|o.06- 



PIP 



2(150) 
0.0567 - 0.04 



1 •< P <0.06+- 1 



<Z< 



2(150) 
0.0633-0.04 



= P[0.0567 < P < 0.0633] 



L 0.016 0.016 

= PI1 .04 < Z < 1 .46] = 0.077 1 . 



b) Sea P -X/ 100 , la proporcion de articulos defectuosos en la muestra de 100 
unidades, donde X , el numero de unidades defectuosos en la muestra de 100 
unidades, es en este caso, #(100, 0.06) . Entonces, 



P[P < 0.05/ p = 0.06] = 1 - P[P > 0.05/ p - 0.06] =1-0.6628 = 0.3372 



donde, se ha utilizado la aproximacion normal de la distribution de P : 



P[P > 0.05/ p = 0.06] 



= P 



Z> 



0.05-0.06 

0.0237 



= P[Z> -0 42] = 0.6628 



EJEMPLO 8.7. 

La probabilidad de que un paciente se recupere de una rara enfermedad es 0.4. 
^Cual es la probabilidad de que en una muestra de 100 pacientes seleccionados de 
una poblacion de 1,000 que sufren la enfermedad, mas del 30% sobrevivan?. 

SOLUCION. 

Sea P - X / 100 , la proporcion de pacientes que se recuperan en la muestra de 
100, donde X, es el numero de pacientes que se recuperan en la muestra de 100 
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Debido a que el muestreo es sin reposicion, X tiene distribution de probabilidad 
hipergeometrica H (1 000, 400, 1 00) 

Para calcular P[P >0.30] se pueden utilizar dos procesos. Uno de los metodos 
es la aproximacion de la distribution hipergeometrica a la normal. En este caso: 

7 X-np X-\0 q0.4) X -40 

yjnp(\-p)((N-n)/(N-l)) 0G(0.4)(0.6)((I000- 1 0Q/(1 000- 1)) 4.6499 



tiene distribucion aproximadamente normal N(0A ) . 

El otro metodo es utilizar la distribucion muestral de proporciones, en este caso: 



Z = 



P-P 



P-0.4 



I p(l-p) f 

V n N - 1 \ 



(0.4)(0.6) 4000- 100 ^ 



100 



1000-1 



P-0.4 

0.0465 



tiene tambien distribucion aproximadamente normal N( 0,1). 
Utilizando la distribucion de la proporcion muestral, se tiene: 

P[P > 0.30] = 1 - P[P < 0.30] = 1-0.9842 = 0.0158 



en donde. 



P[P <0.3] = 




0.3 -0.4 
0.0465 



= P[Z <-2.1 5] = 0.0158 



„c2 

8.2.3 Distribucion muestral de — — 

cr 

TEOREMA 8.2. (Distribucion muestral de la varianza) 

Si X y , X 2 ,... y X n es una muestra aleatoria escogida de una distribucion normal 
/V(p,a 2 ) , y si. 

±[x,-xf 

s 2 =— 

n 

es la varianza muestral, entonces, 
a) f(5 2 )=— ct 2 
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1=1 



b) 






n 



tiene distribution J 2 (n “ 0 



a 

PRUEBA. 

a) Probaremos primero que: 





2>. 

i=l 


-xf=£(X i -n) 2 -n(x-n ) 2 

i = l 


En efecto. 






1=1 


J*, 

c W"i 

II 


-n+M-x) 2 




II 


-m) 2 +2(h-X)]T(X, -h) + «(h- 
1=1 




II 


-n) 2 -2rt(n-X) 2 +rt(n-X) 2 


i=l 


II 

1 

* 


-m) 2 ~n{x -n) 2 . 


Luego, 







—\2 



f - n ^ * /i 

E -y(x,-x) =-Y £[(X,-h) 2 ]-£[(X-h) 2 ] 
n ^ n , 

V i=i J *=i 

W 2 \ a 2 a 2 /? 1 2 
= — \na 1-^— = a ~ a 

m m n n 



E(S 2 ) 



b) Probaremos primero que: 

X(*,- M r=2>,-xF +n (x-rf 



1=1 

En efecto. 



1=1 



£(x,.- m ) 2 =£(x,-x + x-m) 2 

»=i 1=1 
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= £ {x, - X ) 2 + 2{X - n)£ {x, - X )+ n(x - m) 2 



£(X, -n) 2 = £(*, -Xf +n(x -nf.yaque 2(X -ji) l(x, - x)= 0 

1=1 i=I 



Dividiendo pora“ la identidad probada, resulta, 

#i 

\2 



fr( '« ) 



+ n 



(X-p) 2 



Por otra parte, se sabe que, 

n / v 

s r 

1=1 



tiene distribucion xuO y 



2 

tiene distribucion x 2 0) 

Utilizando mctodos avanzados mas alia de este libro, puede demostrarse que 
estas dos ultimas variables son independientes. Luego, por la propiedad 
reproductiva de la distribucion chi-cuadrado resulta que: 

±(x,-*Y 

i_j ... ? 

— 1 tiene distribucion x (w - 1) 



(X-vV 



X-li 

al Jn 



NOTAS. 



1 ) Si definimos la varianza. 



S 2 =- 



n - 1 



i(x,-xY 

i=l 

n - 1 



entonces. 
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~ j n j n 

2) En S = 5 , selieneque >1, cuando «—>+«>, 

n - 1 n - 1 



3) 






Zfo -*) 2 



tlene distribucion x 2 ( n ~ 1) 



( n ^ 2 



n^X, 2 - ^X ^xf-n(X ) 2 



4) Se verifica que: 5 2 = — — ! — = — - 

n(n - 1) 



n - 1 



EJEMPLO 8.8. 

Si S 2 es la varianza de una muestra aleatoria de tamano ai = 1 5 escogida de 
una poblacion normal con media JJ. y varianza a , calcular: 

a) P[0.3107<S 2 /o 2 <1.9427], 

b) P[0.3329< S 2 /a 2 <2.0814] 

SOLUCION. 

a) Con n = 15 la variable aleatoria 15 S 2 /cs 2 tiene distribucion chi-cuadrado con 

14 grados de libertad, entonces, 

P[0.3107 <S 2 /a 2 <1.9427]= P[(15)(0.3107)<15S 2 /<t 2 <(15)(1.9427)] 

= P[4.66 < x 2 (14) < 29. 14] = 0.99 - 0.01 = 0.98. 

'•1 / 7 

b) Con n = 15 la variable aleatoria 14S /a tiene distribucion chi-cuadrado con 
14 grados de libertad, 

entonces, 

P[0.3329 < S 2 /a 2 ^ 2.0814] = P[(14)(0.3329) < 145 2 /ct 2 <(14)(2.0814)] 

= P]4.66 < x 2 (1 4) < 29. 1 4] = 0.99 - 0.01 = 0.98. 
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8.3 OTRAS DISTRIBUCIONES MUESTRALES 



8.3.1 Distribution de 



X-jx 

s/yfn 



TEOREMA 8.3. (Distribution de X cuando C ? se desconoce) 



Sea X x , X n una muestra aleatoria de tamano n escogida de una 

distribucion normal /V(p, a 2 ), donde la vananza poblacional o ? es desconocida 
Entonces, la variable aleatoria: 



7 = 



s/4n 



tiene distribucion /-student con n — 1 grados de libertad, o T ~ t(n - 1) 

En efecto, se ha verificado que: 






o/yfn 



V = 



( n-\)S 2 



~x («- 1). 



ademas las variables Zy V son independientes. 

Entonces, la variable aleatoria: 

? _ x-p 

y]V/(n- 1) S/Vn 

tiene distribucion r-student con /? - 1 grados de libertad. 



NOTA. Observar que 






o ! o J 



Entonces, la variable aleatoria: 



T = 



X-p 



1) s/V^T’ 



tiene tambien distribucion /-student con n - 1 grados de libertad. 
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EJEMPLO 8.9. 

Si X es la media y S 2 es la varianza de una muestra aleatoria de tamano n = 9 
seleccionada de una poblacion normal con media |4. = 90 . calcular 

v _ on 

P10.2353 < , <1.1183], 

5 



SOLUCION. 

En este caso, la variable aleatoria: 

X- M X-90 3(X-90) 

s/jn s/yl 9 S 

se distribuye segun t-student con 8 grados de libertad, esto es, T ~ r( 8) , entonces. 



X —90 

P[0.2353 < — <1.1 183] = A 3 



(3)(0.2353) < 3( - - 9 ° - < (3)( 1 . 1 1 83) 



= p[0.706^f(8)< 3.355] 
= 0.995 - 0.75 = 0.245 



8.3.2 Distribucion muestral de la diferencia de dos 
medias con varianzas poblacionales conocidas 

TEOREMA 8.4. Sean X x y X 2 las medias de dos muestras aleatorias 
independientes de tamanos n x y n 2 seleccionadas de dos poblaciones con medias 
p, y p 2 y varianzas af y a 2 respectivamente, supuestas conocidas, entonces, 
la variable aleatoria X x - X 2 tiene las siguientes propiedades: 

a) =E(x 1 -X 2 )=E(x I )-E(x 2 )= Ml -p 2 . 

2 2 

b > ct Lx 2 = v(x,-x 2 )=v(xO+v(x 2 )=— +— • 

n \ n 2 
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c) Para /?, y n 2 suficientemente grandes , la variable aleatoria: 

„ X |-*2 -(m.-m 2 ) 




tiene aproximadamente distribucion normal /V(0,1) (Verificar!). 



NOTA. 



La aproximacidn de Z a la normal es muy buena si h, > 30 y n 2 > 30 sin 
importar si las poblaciones son discretas o continuas y sin importar sus formas. 

Pero, si las dos poblaciones son normales, entonces, la media X, es 



Por la propiedad reproductiva de la normal Xj-X 2 es normal con 

2 2 

media=p| - y varianza= — — + — — . 

n \ n 2 

Luego, la distribucidn de la variable aleatoria Z: 



es normal A(0,1) para cualquier valor de > 2 y 

EJEMPLO 8.10. 

Se han extraido dos muestras aleatorias del mismo tamano n de dos maquinas 
que embolsan automaticamente un mismo producto cuya caracteristica medible es 
el peso en gramos. Se sabe que los pesos de los productos de cada maquina se 
distribuyen normal mente con medias respectivas iguales a 120 gramos y con 
varianzas respectivas iguales a 1 8 gramos 2 . Encontrar el valor de n de manera que 
la probabilidad de que las medias muestrales difieran en menos de 2 gramos sea 
0.95. 

SOLUCION. 

Sean X, y X 2 las medias de los pesos de las muestras respectivas. Los pesos 
de las poblaciones se distribuyen normalmente con medias iguales y varianzas 
iguales. Entonces, la diferencia de las dos medias muestrales X x -X 2 tiene 
distribucion normal con: 




2 = ^2 ~ (pi ~ M2) 
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n of 18 + 18 36 

Media: |ij-|i 2 -0, y varianza: + — = = — . 

n } n 2 n n 



Luego, la variable 



X — X — 0 

Z = — 1 . 2 — se distribuye como normal N(0>\ ). 

y]36/ rt 

Se debe hallar el valor de n tal que pjjx, -X 2 |<2]=0.95 , entonces. 



0.95 = pjx,-X 2 |<2]=/>|z|<J^ 

yfn 



= P 



■Jn „ 4n 

<Z < 

3 3 



= 2G> 






v 3 . 



-1, 



de donde resulta, 
2 1 -Jr N 






-1 = 0.95, 0.975 



— = 1 .96, 4n= 5.88 , n = 34.57 s 35. 

3 



8.3.3 Distribution muestral de la diferencia de dos 
medias con varianzas poblacionales desconocidas 

Sea X, la media de una muestra aleatoria de tamano n x extraida de la 
poblacion normal /V(p lT af), y sea X 2 la media de otra muestra aleatoria de 

tamano n 2 extraida de la poblacion normal A^(p 2 ' a 2 )» independiente de la 
anterior. 

A) Varianzas poblacionales iguales: of = of - a 2 

En este caso, la variable aleatoria X! - X 2 tiene distribution normal 

( 2 2 \ 

A/ cr, a 2 

N\ Mi -M2. + • 

^ «1 «2 ) 

y la variable aleatoria estandar: 
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Z = 



X } -X 2 - ^1 “ 1^2 ) _ ”^ 2 ) 



— + — 
n } n 2 



V n \ n 2 



tiene distribucion normal N( 0,1). Por otra parte, 

( ri \ — l) 5 i 2/ (a!2 — ^*^2 2/ 

2 X ("1 -1), y 2 x (n 2 -\) 



„ («j - 1)5 2 (n 2 -DS 2 2 2 

y, v= , • + — £ -i x(»i+«2-2) 



Por tanto, la variable aleatoria: 

z (x,-x 2 )-(h,-m 2 ) 

I v HOF 

\n,+n 2 - 2 y „ t „ 2 



tiene distribucion f-student con n, + n 2 - 2 grados de libertad. 
Donde, S c la varianza comun, tiene la expresion: 

cl _ ( n l + ( n 2 - 1)*^2 

— 

n l +^2 ~ ^ 



B) Varianzas poblacionales diferentes af ^a 2 



En este caso la variable aleatoria: 



7 = 



(x.-XjJ-fo-jiJ 




tiene distribucion r-student con g grados de libertad, donde, 
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Si g 




n, — I n 2 -1 

no es un numero entero se redondea al entero mas cercano. 



8.3.4 Distribucion muestral de la diferencia de dos 
proporciones 

Scan X,,X 2 ,...X ni e Y lt Y 2 Y ^ dos muestras aleatorias indcpendicntes 

de tamanos n } y n 2 seleccionadas respectivamente de dos poblaciones 
independientes de Bernoulli B(\ y p } ) y B(\, p 2 ) , donde p } y p 2 son las 
proporciones poblaciones de exito respectivos. Sean las proporciones muestrales 




fij n t n 2 n 2 



donde X ~ B(n } ,p } ) y E ~ B(n 2 , p 2 ) 

Entonces, la variable aleatoria P } — P 2 tiene una distribucion de probabilidad cuyas 
propiedades son las siguientes: 

a) = £ (^ - £ 2 )= E [Pi )- E fa)= Pi 'Pi- 



b > )=^(p,) + v(/> 2 )= 



P j (1 Pi) t P20-P2 ) 



M ,l 2 

c) Para n, y n 2 suficientemente grandes, la variable aleatoria estandar: 

P\ ~ Pi ~(P\ ~ Pi) 



Z=- 
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tiene distribution aproximadamente /V(0,1), donde el error esidndar a ^ ^ . es 
dado por: 



°p,-p, 



PiQ-Pi) , P 2 U-P 2 ) 



«2 



EJEMPLO 8.11. 

Dos amigos A y B juegan "cara" o "sello" con una moneda. Suponga que en 
este juego, cada uno lanza la moneda 35 veces y que uno de ellos gana si obtiene 7 
caras mas que el otro. Calcular la probabilidad de que B gane el juego. 

SOLUCION. 

Sea X el numero de caras que saca el jugador A en las 35 tiradas y sea Y el 
numero de caras que saca el jugador B en las 35 tiradas, entonces, cada variable 
tiene distribucion £(35,0.5), donde p = 0.5 es la probabilidad de obtener cara en 
cada tirada de los jugadores. 

Sean P x = X/35 y P 2 = Y / 35 las proporciones de caras de los jugadores A y B 
respectivaniente. El jugador B gana el juego si saca 7 caras mas que A o si su 
proporcion de caras es 7/35 = 0.2 mas que A. Luego, la probabilidad de que B 
gane el juego es: 

p[p 2 -P x > 0.2]= 1 - p[¥ 2 - P t < 0.2] = 0.0475, donde: 



P[P 2 -P X <0.2 ]=P 



Z< 



I 



0.2 -(0.5 -0.5) 
(0.5)(0.5) “ (05)(0.5) 



35 



35 



P[Z < 1 .67] = 0.9525 



8.3.5 Distribucion muestral de la razon i, 2 /sj 

TEOREMA 8.5. Si S? y son las vananzas de dos muestras aleatorias 
independientes de tamanos /ij y n 2 seleccionadas de dos poblaciones normales 
A(pj ,a, 2 ) y N(p 2 »<72) respectivas, entonces, la variable aleatoria 
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tiene distribucidn F con grados de libertad n, - 1 y n 2 - 1 , esto es, 
F ~ F(n x - 1, n 2 - 1 ) . 

En efecto, la variable aleatoria U = ( n \ - 1)5, 2 /o, 2 se distribuye como Chi 2 con 

m, -1 grados de libertad y la variable aleatoria V =(n 2 -l)5 2 / a 2 se distribuye 
como Chi 2 con n 2 - 1 grados de libertad. Ademas son independientes. Luego la 
variable: 

F ty/(«, -i) s.Vof 

V/(« 2 - 1) s\/cs\ 

se distribuye segun F con grados de libertad n, - 1 y « 2 - 1 . 

Observar que si a, 2 = a 2 , entonces, F = 5 2 / S 2 se distribuye segun F con 

grados de libertad - 1 y n 2 - 1 , o F - F(n, — 1, n 2 - 1) 

EJEMPLO 8.12. 

De poblaciones N(ix ]J o 2 ) y W(p 2 »a 2 ) independientes se extraen dos muestras 
de tamafios 13 y 21 respectivamente, hallar el valor de k tal que: 

a) P[Si <JfcSf] = 0.99 

b) P[S, 2 / S\ < *] — 0.05 

SOLUCION. 

a) P[S 2 < kSj 1 = 0.99 , implica PJF <t] = 0.99 , donde F = S 2 /s| ~ F(1 2, 20) 
Entonces, A: = 3.23. 

b) P[Sy tsl<k) = 0.05 , implica P[F<k] = 0.05 , 

donde F = 5 2 js\ ~ F( 12,20). Entonces, k = l//o 9 s 20.12 =1/2.54 = 0.394. 
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EJERCICIOS 

Una media 

1. De una poblacion normal N(6,6 2 ) se selecciona la muestra aleatona: 
X t ,X 2 ,...,X y de tamano 9. Sea X la media de la muestra aleatoria 

a) Describa la distribucion de probabilidades de X . 

b) Determine el valor de c tal quc P[X > c] = 0.985 . 

c) Si K = 3X - 5 , calcular P[Y > 28] . 

Rp. a) N( 6, 36/9), b) c = 1 .66, c) 0.0062. 

2. Una poblacion finita X consistc de los valores: 0, 2, 5, 8. Determine la 
distribucion muestral de la media X para las mucstras de tamano dos 
escogidas de esta poblacion: 

a) con sustitucion, b) sin sustitucion. 

Rp. a) I6medias, = 3.75, =4.59, b)12medias, |U ^ = 3.75, <T^ = 3.445. 

3. Suponga quc los sueldos en cientos de dolares, en una region, es una variable 
aleatoria X cuya distribucion de probabilidades es : 



X 


1 


2 


3 


4 


5 


fix) = P\X =.v] 


0.1 


0.2 


0.4 


0.2 


0.1 



si se toman al azar 30 sueldos de igual numero de personas. 

a) halle la media y la varianza de la media muestral. 

b) calcule la probabiiidad de que la media muestral este entre 260 y 330 

dolares. Rp. a) 3. 0.04. b) 0.9104. 

4. La demanda diaria de un producto puede ser 0, I, 2, 3, 4 con probabilidades 
respectivas 0.3, 0.3, 0.2, 0.1, 0.1. 

a) Describa la distribucion de probabilidades aproximada de la demanda 
promedio de 36 dfas. 

b) Calcular la probabiiidad de quc la media de la demanda de 36 dias este entre 
1 y 2 inclusive. 

Rp. a) Aproximadamente normal A/( 1 .4, 1 .64/36) b) 0.9668. 

5. De la historia sacada de los registros de la Universidad se ha determinado que las 

calificaciones del curso de MATE1 y de FILOl se distribuyen normalmente con 
las medias respectivas 12 y 15 y con varianzas homogeneas igual a 4. ^Cual es 
la probabiiidad de que el promedio las notas de un alumno en tales cursos este, 
entre 13 y 16?. r p . 0.5984 
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6. El gerente de ventas de una empresa cafetalera sabe que el consumo mensual 
de cafe por casa (en kilos) esta normalmente dislribuida con media desconocida 
p y desviacion estandar igual a 0.3. Si se registra el consumo de cafe durante 
un mes de 36 hogares escogidos al azar, ^cual es la probabilidad de que la media 
del consumo este entre los valores p-0.1 y p + 0.1?. 

Rp. 0.9544 

7. La distribucidn de las notas del examen final de Mat.I resulto ser normal 

N(p,o 2 ) , con cuartiles 1 y 3 iguales a 6.99 y 1 1 .01 rcspectivamente. 

a) Determine la media y la varianza de la distribucion de las notas 

b) Halle el intervalo [a. b] centrado en p tal que P\a < X < b] = 0.9544, donde 

X es la media de la muestra X,,X 2 ,X 3 ,X 4 cscogida de esa poblacion. 

Rp. a) p=9. 0=3. b) a =6. b =12. 



8. La vida util (en miles de horas) de una baterfa es una variable alcatoria X con 
funcion de densidad: 



/(*) = 



J 2 - 2x 
1 0 



0 < A < 1 

en cl rcsto 



Si X 36 es la media de la muestra aleatoria X,,X 2 ,.. 



que probabilidad X 36 es mayor que 420 horas? 



X 36 escogida de X, ^con 
Rp. 0.0136. 



9. Sea X^ la media de la muestra aleatoria X,,X 2 ,...,X 40 de tamano n = 40 

escogida de una poblacion X cuya distribucion es geometrica con funcion de 
probabilidad: 






,* = 1 , 2 ,... 



Hallar la probabilidad de que la media mucstral dificra de la media poblacional 
en a lo mas el 10% del valor de la varianza dc la poblacion 

Rp. 0.9954 



10 . La utilidad (en miles dc soles) por la venta dc cierto artfculo, es una variable 
alcatoria con distribucion normal. Se estima que en el 5% de las ventas la 
utilidad serfan menos de 6.7 L mientras que el 1% de las ventas serian mayores 
que 14.66. Si se rcalizan 16 operaciones de ventas, ^cual es la probabilidad de 
que el promedio de la utilidad por cada operacion este entre $10,000 y 
$ 1 1 , 000 ?. 

Rp. 0.4772. 
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11. La vida util de cierta marca de llantas radiales es una variable aleatoria X cuya 
distribution es normal con jn = 38,000 Km. y a = 3,000 Km. 

a) Si la utilidad Y (en $) que produce cada llanta esta dada por la relation: 
Y = 0.2X +100, ^cual es la probabilidad de que la utilidad sea mayor que 
8,900$? 

b) Determinar el numero de tales llantas que debe adquirir una empresa de 

transporte para conseguir una utilidad promedio de al menos $7541 con 
probabilidad 0.996. Rp. a) 0.0228, b) * = 1 00 

12 . Un proceso automatico llena bolsas de cafe cuyo peso neto tiene una media de 
250 gramos y una desviacion estandar de 3 gramos. Para controlar el proceso, 
cada hora se pesan 36 bolsas escogidas al azar; si el peso neto medio esta entre 
249 y 25 1 gramos se continua con el proceso aceptando que el peso neto medio 
es 250 gramos y en caso contrario, se detiene el proceso para reajustar la 
maquina. 

a) iC ual es la probabilidad de detener el proceso cuando el peso neto medio 
realmente es 250?. 

b) ^Cual es la probabilidad de aceptar que el peso neto promedio es 250 
cuando realmente es de 248 gramos?. 

Rp. a) 0.0456, b) 0.0228 

13 . En cierta poblacion de matrimonios el peso en kilogramos de esposos y esposas 
se distribuye normalmente /V(80,100) y N( 64,69) respectivamente y son 
independientes. Si se eligen 25 matrimonios al azar de esa poblacion calcular la 
probabilidad de que la media de los pesos sea a lo mas 1 37 Kg. 

Rp 0.0036. 

14 . Una empresa vende bloques de marmol cuyo peso se distribuye normalmente 
con una media de 200 kilogramos. 

a) Calcular la varianza del peso de los bloques, si la probabilidad de que el 
peso este entre 165 Kg. y 235 Kg es 0.9876. 

b) ^,Que tan grande debe ser la muestra para que haya una probabilidad de 
0.9938 de que el peso medio de la muestra sea inferior a 205 Kg.? 

Rp. a) 0-14, b) n- 49 

15. La duration en horas de una marca de tarjeta electronica se distribuye 
exponencialmente con un promedio de 1000 horas. 

a) Hallar el tamano n de la muestra de manera que sea 0.9544 la probabilidad 
de que su media muestral este entre 800 y 1200 horas. 

b) Si se obtiene una muestra aleatoria de 100 de esas tarjetas calcular la 

probabilidad que la duration media de la muestra sea superior a 1,100 
horas. Rp. a) n = 100, b) 0. 1587. 
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16. Un proceso para llenar cerveza en botellas de 620 ml. sufre una pcrdida en el 
contenido que tiene una media de 5 ml. y una desviacion estandar dc 1 .2 ml.. Sc 
escogen al azar 36 de tales botellas. Si la meda de la muestra esta entre 4.5 y 5.5 
ml. se acepta que p=5 ml., en caso contrario; se rechaza que |i=5. <Cual es la 
probabilidad de aceptar que p=5 cuando realmente es p=4.8 ml.?. 

Rp 0.9330. 

17 . Una empresa comercializa fardo* de algodon cuyo peso X se distribuye 
normalmente con una media de 250 Kg. y una desviacion estandar de 4 Kg. El 
costo por fardo es dado por Y = aX + 52 . Hallar cl valor dc a si se quiere que la 
media de los costos de 4 fardos sea mayor que $3,100 con probabilidad 0.0228. 

Rp. 12 

18 . Definimos la variable aleatona "error muestral", por: [X-pj. De todas las 

muestras de tamano 36 escogidas al azar dc la poblacion /V(p,324) , 

a) ^que porcentaje tendran un error muestral mayor de 4.5?. 

b) i,para que valor dc k cl 95% lienen error muestral no mayor que kl. 

Rp. a) 0.1336, b) A: = 5.88. 

19 . El costo de produccion en dolarcs de un objeto cs 1 00 veces el valor numcrico 
de su longitud. Suponga que la longitud en metros del objeto es una variable 
aleatona con distribucion normal N( 0.012, 1.44X10 -4 ). 

a) ^Cual es la distribucion del costo medio por objeto si se toman al azar n ( n > 
2) objetos?. 

b) Si el precio de venta dc cada objeto es $2.00, calcular la probabilidad de que 
la utilidad promedio por objeto de 36 objetos tornados al azar, sea a lo mas 

$05. 

Rp. a) Ml 2, I 44//J), b) t7 3fi eeM0.8. 0.04), P\ U <0.5]=0.0668 

20 . Un analista de investigacion de mercado toma una muestra aleatona de 36 
clientes de una tienda, de un conjunto de 400 clicntes que adquirieron un cupon 
especial. El monto de las compras mensuales de los 400 clientes constituye una 
poblacion finita con una media de 2,500 dolares y una desviacion estandar de 
$660. <Cual es la probabilidad de que la media de la muestra supere los $2765?. 

Rp poblacion finita, 0.0059 

21 . Un auditor quiere tomar una muestra aleatona de una poblacion que consiste de 
10,000 cuentas por cobrar, donde a = $2000. ^De que tamano debe escoger la 
muestra si se quiere tener una probabilidad del 95% dc que la diferencia entre la 
media muestral y la media poblacional no exceda el valor $192? 

Rp. Poblacion finita, n = 400 
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22. La calificacion en una prueba de aptitud es una variable aleatoria X que tiene 
distribucion normal con media igual a 100. 

a) Si se supone que la desviacion estandar de lodas las calificaciones es a = 1 5, 
^cuantas calificaciones se deben escoger para que la media muestral este en 
el intervalo de 90.2 a 109.8 con probabilidad 0.95?. 

b) Si se escogen al azar 16 calificaciones y se encuentra que la desviacion 

estandar s = 12, ^cual es la probabilidad de que la media muestral se 
encuentre entre 92. 1 94 y 1 04.023?. Rp. a) n = 9, b) 0.89. 

23 . El gerente de produccion afirma que las batenas que produce duran en 
promedio tres afios. En el control de calidad se verifican 16 batenas y si el valor 

de t calculado: t c = (3c — 3 ) listen) esta entre —^05 y ^005* fabricante 
esta satisfecho con su afirmacion. ^Que conclusion sacara el fabricante si la 
muestra da una media de 3.8 anos y una desviacion estandar s = \5 afios?. 
Suponga que la duracion de las batenas tiene distribucion normal. 

Rp. / t =2.13e [-1 .753, ! .753], es un producto mejoi de lo afirmado. 



Una Proporcion. 

24 . Se estima que el 40% de los votos de los electores de la ciudad favorecen al 
candidato Sr. Diaz. 

a) Si se selecciona una muestra aleatoria de 600 electores de la ciudad, ^que 
probabilidad hay de que la proporcion muestral de votos a favor del Sr Diaz 
este entre 37% y 45 %? 

b) <^Que tamano de muestra se debena escoger si se quiere tener una 
probabilidad igual a 0.97 de que la proporcion de votos a favor del Sr. Diaz 
en la muestra no se diferencie de su proporcion estimada en mas del 2%?. 

Rp. a) P[-l ,5<Z<2.5]=0.9270. b) «=2825.34=2826. 



25 . Una empresa que hace estudios de mercado quiere obtener una muestra aleatoria 
suficientemente grande de manera que la probabilidad de que la proporcion 
obtenida a favor de un cierto producto resulte inferior al 35% sea igual a 
0.0062. 

a) Calcular el tamano de la muestra a tomar si se supone que la verdadera 
proporcion a favor del producto es p - 0.4. 

b) Con el tamano de muestra calculado en a) y si se supone verdadero el valor 
del parametro p=0.2, determinar el intervalo [a y b] centrado en p tal que 

P €[a*b] con probabilidad 0.95 Rp. a) /i = 600. b) [0.1608. 0.2392] 

26 . Un fabricante afirma que a lo mas el 2% de todas las piezas producidas son 
defectuosas. Al parecer esta informacion es exagerada, por lo que se selecciona 
una muestra aleatoria de 400 de tales piezas. Si la proporcion muestral de 
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defectuosos es mayor que 3% se rechaza la afirmacion, en caso contrario se 
acepta la afirmacion. 

a) ^,Cual es la probabilidad de rechazar la afirmacion cuando realmente el 2 % 
de todas las piezas producidas son defectuosas? 

b) 6 CuaI es la probabilidad de aceptar la afirmacion cuando realmente el 4% de 
todas las piezas producidas son defectuosas? 

Rp. a) 0.0764. b) 0.1539 

27 . El director de la bolsa de trabajo de la universidad afirma que el 60% de los 
egresados consigue empleo con una remuneracion mayor a los $500. Para 
comprobar esta afirmacion se escoge una muestra aleatoria de 600 egresados de 
la universidad. Si 330 o mas pero no mas de 390 de la muestra consiguen 
trabajo con remuneracion mayor a los $500, se aceptara la afirmacion. En caso 
contrario se rechazara tal afirmacion. 

a) ^Cual es la probabilidad de rechazar la afirmacion cuando esta es 
realmente verdadera.?. 

b) ^Cual es la probabilidad de aceptar la afirmacion cuando realmente el 70% 

de todos los egresados consiguen trabajo con remuneracion mayor a los 
$500?. Rp. a) 0.0124, b) 0.0038. 

28 . Para controlar la calidad en un proceso de produccion de cierto bien de 
consumo, se seleccionan al azar 46 unidades del bien cada dia. Si la proporcion 
de objetos defectuosos en la muestra es al menos p 0 , se detiene el proceso, 
de otro modo se continua con el proceso. Determine aproximadamente el valor 
de p 0 para que con probabilidad de 0.9332 no se continue con el proceso, 
cuando la produccion total contenga 8% de objetos defectuosos. 

Rp 0.02. 

29 . Un nuevo producto va a saiir al mercado si por lo menos el p 0 ( 100%) de n 
personas encuestadas, aceptan el producto. Calcular los valores de n y p 0 de 
manera que haya una probabilidad de 0.11 12 de que el producto no saldra al 
mercado cuando realmente el 58% lo aceptan y una probabilidad de 0.0228 de 
que el producto saldra al mercado cuando realmente el 50% lo aceptan. 

Rp n = 400, p = 0.55 . 
o 

30 . Por experiencia el departamento de creditos de una tienda comercial sabe que 
sus ventas se pagan con: dinero en efectivo, con cheque o al credito, con 
probabilidades respectivas; 0.3, 0.3, y 0.4.. La probabilidad de que una venta 
sea por mas de $50 es igual a 0.2 si esta es en efectivo, es igual a 0.9 si esta es 
con cheque y es igual a 0.6 si esta es al credito 
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Si se escoge una muestra aleatoria de 256 personas que ingresan a la tienda, 
^cual es la probabilidad de que el porcentaje de personas que hayan comprado 
por mas de $50 sea al menos 50%?. 

Rp. 0.9881. 

31 . De 3000 empleados de una empresa se escoge una muestra aleatoria de 300 
empleados para una encuesta sobre condiciones laborales. ^Cual es la 
probabilidad de que la proporcion muestral a favor de las condiciones laborales 
este comprendido en el intervalo 0.76 y 0.84, si se estima en 80% del total de 
empleados el porcentaje a favor de las condiciones laborales?. 

Rp. 0.9328 

32 . Una empresa encuestadora debe seleccionar una muestra aleatoria de una 
poblacion que consiste de 3000 electores para una encuesta de opinion. La 
empresa estima en 30% del total, el porcentaje a favor de cierto candidato. ^De 
que tamano debe escoger la muestra si se quiere tener una probabilidad del 95% 
de que la diferencia de la proporcion a favor del candidato en la muestra y en la 
poblacion no exceda el valo 0.0492? 

Rp. n = 300 



Varianzas 

33 . Si X l% X 2 ,—'X 8 son ocho variables aleatorias independientes y distribuidas 

cada una normal JV( 10,32), calcular la probabilidad de que la varianza muestral 
S 2 = X(X 4 - X) 2 /8 sea menor o igual que 56.28. Rp 0.95. 

34. Calcular la probabilidad de que una muestra aleatoria de tamano 13 escogida de 

2 A 2 

una poblacion normal con varianza a =4 tenga una varianza muestral S , 

a) menor que 7.01, b) entre 1.19 y 2.1 

Rp. a) 0.95. b) 0.09 

35 . Si X 1 ,X 2 ,.-.,X 9 son 9 variables aleatorias independientes y con distribucion 

normal, yV(8,4), calcular la probabilidad P[1.09 < S 2 < 10.045, 7 < X <9] 
(X y S 2 son independientes). Rp. 0.836). 

36 . Utilizando la tabla de la distribucion F hallar: 

a ) ^0.95,10.15 » b) ^0.99.15,9 » C ) ^0.05.30.8 » ^0.01.15.9 

Rp. a) 2.54, b) 4.96, c) 0.4405, d) 0.257. 
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37. Dos muestras aleatorias independientes de tamanos 21 y 9 respectivamente se 
toman de una misma poblacion que esta normalmente distribuida, <,cual es la 
probabilidad de que la varianza de la primera muestra sea al menos el Quadruple 
de la varianza de la segunda?. 

Rp. 0.025 

38. Sean. X , ~x 2 (9), X 2 ~x 2 (20) y X = (*, /9)/(X 2 /20) hallar los valores ay b 
tales que: 

P[a < X < b] =0.925 y P[X < a] =0.05. 

Rp. f>=2.84. 0=1/2.94=0.34 

39. Sea X t ,..., X l0 una muestra aleatoria escogida de una poblacion normal 

M0.1), 

10 / 5 

a) Hallar la distribucion de F = (£ Xf ) / 10 / Xf )/5 , 

1=1 / i= 1 

b) Calcular la probabilidad P[F < 1/3.33] 

Rp a)F~F(10.5), b)0.05 



40. Sea X, y X 2 una muestra aleatoria escogida de una poblacion normal /V(0.1). 

' X x +x 2 n2 



a) Hallar la distribucion de F = 

X, -X 2 

b) Calcular la probabilidad P[F<161] 



Rp. a) F-FOJ). b) 0.95 



Diferencia de do s medias 

41. Para comparar la duracion promedio (en meses) [i, y \i 2 de dos marcas de 
baterias B1 y B2 se escogen dos muesuas aleatorias independientes de tamanos 
respectivos n, = 32 y n 2 = 36. Si la media muestral de B 1 es mayor que la 
media muestral de B2 en mas de 2 meses, se acepta que pj >p 2 -^ n caso 
contrario se acepta que p, =p 2 Calcular la probabilidad de aceptar que 
p, >p 2 cuando realmente pj =p 2 - Suponga que las varianzas de las 
duraciones de B1 y B2 son respectivamente a, 2 =16 y a 2 = 9. 

Rp. 0.0104 
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42. Una firma comercializadora afirma que el peso promedio (en gramos) p, y 

p 2 de dos marcas dc cafe instantaneo Cl y C2, es el mismo. Para verificar la 
afirmacion se escogen dos muestras aleatorias independientes de tamanos 36 
sobres de cada marca.. Si la media muestral de Cl es mayor que la media 
muestral de C2 en mas de 0.5 gramos, se rechaza que p, = p 2 . En caso 
contrario, se acepta que |ij = p 2 . es la probabilidad de aceptar que 

P! = p 2 cuando realmente pj =p 2 +2 7. Suponga que las varianzas de las 
poblaciones Cl y C2 son respectivamente <jj =9 y <j 2 —4 

Rp. 0.0062 

43. El jefe de compras esta por decidir si comprar una marca A o una marca B de 
focos para la compama. Para ayudarle a optar por una de ellas se escogen dos 
muestras aleatorias de tamanos /ij = 10 y n 2 =9 focos respectivamente de las 
marcas A y B, resultando, las desviaciones estandares respectivas £, = 200 y 
s 2 = 150. Si la diferencia entre las medias muestrales es mayor que 173 boras, 
se acepta que p, ^p 2 . En caso contrario, se acepta que p, = p 2 . ^Cual es la 
probabilidad de aceptar que P] * p 2 cuando realmente p, =p 2 ?. Se asume 
que la vida util de ambas marcas tiene distribucion normal con varianzas 
iguales. 

Rp. 7~/(17), 0.05. 



44. Para comparar los salarios que se pagan a los empleados en dos grandes 
empresas El y E2 se escogen dos muestras aleatorias independientes de 
tamanos = 16 y n 2 = 13 respectivamente de El y E2 resultando las 
desviaciones estandares respectivas =$120 y s 2 = $55. Si la diferencia entre 
las medias muestrales no es mayor que 65$, se acepta que pj = p 2 . En caso 
contrario, se acepta que pj ^p 2 . ^Cual es la probabilidad de aceptar que 
Pi 7 tp 2 cuando realmente p, =p 2 9 . Se asume que los salarios en ambas 
empresas tienen una distribucion normal con varianzas diferentes. 

Rp 7*~K22),0.I0 



Diferencia de dos proporciones. 

45. Dos programas de television A y B tienen como ratings (porcentaje de hogares 
donde se ve el programa) de 40 y 20 respectivamente. Se toma una muestra 
aleatoria de 300 hogares con T.V. durante la transmision del programa A y otra 
de 100 hogares durante la transmision de B, ^cual es la probabilidad de que los 
resultados muestren que el programa A tiene un rating mayor a la de B en 10%?. 

Rp. 0.0207 
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46. Un fabricante afirma que el 30% de mujeres y el 20^ de hombrcs prefiercn su 
nuevo producto de aseo personal. Si se hace una encuesta a 200 hombres y 200 
mujeres elegidos aleatoriamente, ^con que probabilidad la proportion muestral 
de mujeres menos la proportion muestral de hombres esta en el intervalo 
[-19%, 19%]? 

Rp. 0.9634 

47. Se escoge una muestra de 600 electores que aeaban de votar, entre las 9 a m. y 
las 3 p.m. para estimar la proportion de votantes a favor de los candidates A y 
B En una entuesta hetha en la vfspera se estimo en 30% y 35% los poreentajes 
a favor de A y B respectivamente. ^Cual es la probabilidad de que la proportion 
muestral de B exeeda a la proportion muestral de A en al menos 10%?. 

Rp. 0.0322. 
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ESTIMACION DE PARAMETROS. 



9.1 Introduction 

A1 realizar una investigacion estadfstica a menudo se sabe o se supone que 
la poblacion (discreta o continua), de la cual se selecciona una muesira 
aleatoria, tiene una forma funcional especffica/fx) cuyo(s) parametro(s) se intenta 
determinar. Si el parametro a determinar es denotado por 0, entonces. la 
distnbucion de la poblacion sera denotada por /(jc, 0). 

Los metodos de inferencia estadfstica consisten en seleccionar una muestra 
aleatoria de la poblacion, de manera que a partir de la informacion que se obtenga 
de la muestra: 

1 ) Determinar el valor del parametro desconocido 0, 6 

2) Decidir si 0, 6 alguna funcion de 0, es igual a algun valor preconcebido 

0 O de 0. 

El primero de estos dos procedimientos se denomina estimation del 
parametro 0. El segundo procedimiento se conoce como prueba de hipotesis del 
parametro 0. 

El metodo de estimacion de un parametro puede ser puntual o por intervalo . En 
el primer caso, la estimacion del parametro 0 es un numero. Mientras que en el 
segundo caso la estimacion incluye un intervalo en el que estan comprendidos los 
valores del parametro. 
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9.2 Estimacion puntual de parametros 

Definition. Sea X x , X 2 ,..., X n una muestra aleatoria de tamano n seleccionada de 
una poblacion cuya distribution es fix, G), siendo 0 el parametro. Se denomina 
estimador puntual del parametro G a cualquier estadistica © = H(X } ,X 2 , ,X n ) , 

cuyo valor G = H(x } , x n ) proporcionara una estimacion del parametro en 
cuestion. 

Un estimador puntual del parametro G es pues, una variable aleatoria (funcion 

de la muestra) © , mientras que una estimacion puntual es el valor numerico G 
del estimador. 

Por dar un ejemplo, un estimador puntual de la media poblacional 6, es la 
estadistica media muestral (variable aleatoria) © = X , cuyo valor numerico G = v 
es la estimacion puntual del parametro G. 

No toda funcion de la muestra es un buen estimador del parametro. un buen 
estimador, es aquel que esta mas cerca del parametro que se estima. Para que un 
estimador puntual sea bueno debe tener ciertas propiedades. Una de estas 
propiedades es que sea insesgado , propiedad conocida tambien como no - 
sesgado , impartial, o sin vicio. 



9.2.1. Estimador insesgado 

Deflnicion. Se dice que la estadistica © = H(X x , X n ) es un estimador 

insesgado del parametro G si £(©) = 0 . En caso contrario, se dice que es 
estimador sesgado. 

Si la estadistica © = H(X ] , X 2 ,..., X n ) es un estimador insesgado del 
parametro 0. entonces, su valor G= H(x x , Jt 2 ) es la estimacion insesgada 
del parametro G. 

EJEMPLO 9.1. 

Sea X ]f X 2 ,... f X n una muestra aleatoria de tamano n extraida de una 

poblacion cualquiera /(jt,p,o 2 ) , (discreta o continua). Entonces, 

a) La media muestral X es un estimador insesgado de la media poblacional p, 
ya que 

e(x)=h. 
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El valor x de X es la estimacion insesgada de p. 

b) La proporeion muestral P es un estimador insesgado de la proporcion de 
exitos p de una poblacion binomial, por que, 

e[p)= p . 

c) La varianza muestral 

i (x>-*y 

S 2 = — 

n 

2 

es un estimador sesgado de la varianza poblacional a , ya que 




Sin embargo, la estadfstica, 

±(x,-*r 

S 2 =-i^ 

n - 1 

es un estimador insesgado de la varianza poblacional a 2 , por que, 

£(s 2 )=g 2 . 

NOTA. El calculo la varianza por S 1 es denominado metodo de muestra 

mientras que el calculo de la varianza por 5 2 es denominado metodo de 
poblacion. Observar que cuando n es suficientemente grande el coeficiente 
( n - 1 )/n tiende a uno. 

EJEMPLO 9.2. 

a) La diferencia X x - X 2 de dos medias muestrales es estimador insesgado de la 
diferencia p, -p 2 d° s tnedias poblaciones. Yaque, 

£(J,-F 2 )=H, -h 2 . 

b) La diferencia de dos proporciones muestrales - P 2 es un estimador 
insesgado de la diferencia de dos proporciones de exitos binomiales /?, - p 2 . 
Puesto que, 

_ ^2 )“ P\ - P2 
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9.2.2. Estimador eflciente 

Definition. Si hay dos o mds estimadores puntuales insesgados de un parametro 0, 
se denomina estimador mas eficiente a aquel estimador que tenga menor varianza. 

EJEMPLO 9.3. 

Sea X,,X 2 ,X 3 ,X 4 una muesira aleaioria de cualquier poblacion con 
distribucion f(x , p, a ) . Dados los estimadores del parametro p: 

A X,+X 2 + X 3 + X 4 A 4X,-X 3 +X 4 

a) ©, = — 2 — i y b) © 2 = — 1 

4 4 

verificar que la media de la muestra; es el estimador mas eficiente de p. 

SOLUCION. 

Ambos estimadores son insesgados. En efecto. 



Por otra parte, las varianzas respectivas son: 



v (e , )= i ^-= ; 7- y e(©2>= 



16 a" 



16 



18a 2 

16 



Luego, la estadistica 0, que esta definida como la media de la muestra; es el 
estimador mas eficiente de p 

Uno de los metodos para determinar estimadores puntuales es el de maxima 
verosimilitud que se describe a continuation. 



9.2.3. Metodo de maxima verosimilitud 

Supongamos que una poblacion X esta distribuida como/(.r,0), en donde 0 es el 
parametro que tratamos de estimar. 

El procedimiento para determinar el estimador de maxima verosimilitud es como 
sigue: 

1) Elegir una muestra aleatoria X 1 ,X 2 ,...,X n de la poblacion y determinar la 
distribucion conjunta de la muestra en sus valores observados respectivos 
jc, . E sla funcion del parametro 0 conocida tambien como funcion de 

verosimilitud esta dada por: 
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L(6) = /(x, , x 2 x n , 6) = /(x, , 6 )/(x 2 , 0).../(x„ , 0) = /(x, , 6). 

i=l 

2) El valor de 0 que maximiza a la funcion L(0), es la estimation de maxima 
verosimilitud (EMV) de 0. Este valor denotaremos por 

La estadfstica correspond iente © = //( X l% X n ) es el estimador de 

maxima verosimilitud de 0. 

3) A menudo se usa L = ln(L(0)) . En este caso el valor de 0 que maximiza a L(0) 
es la solution 0 de la ecuacion: 

^ = 0 . 
de 

4) Si la distribution de probabilidad de la poblacion contiene k parameiros 
0] ,0 2 ,...,6* , la funcion de verosimilitud esta dada por: 

n 

L(e ] ,e 2 ,...,e k ) /(*, ,e, ,e 2 ). 

i= 1 

La estimation de maxima verosimilitud de cada parametro 0/ es la solution 0 f 
de la ecuacion respectiva: 

°L.o. JL.o,.... -^.0 

d 0 ! de 2 00 ^ 

donde L = !n(L(0, ,0 2 ,...*0^ )) . 

EJEMPLO 9.4. 

Sea X ] , X 2 ,.. X n una muestra aleatoria de tamano /z, seleccionada de una 

poblacion con distribucion binomial B(\, p). Hallar el estimador del parametro p 
usando el metodo de maxima verosimilitud. 

SOLUCION. 

La distribucion de probabilidad de cada variable aleatoria X es: 

f(x i ,p) = p x >(l-p)'- x i, X,. =0,1. 
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La funcion de verosimilitud de la muestra aleatoria es entonces, 

up) = n fix, , P ) = [ P f x (i - P f - z *■ (*) 

1=1 

n 

Luego, L = ln(L(p))= (ln(/?))^-t, + (ln(l - p)) 

i=i 

Derivando la funcion L con respecto ape igualando a cero, da: 



n n 




dp p 1 - p 

De donde resulta que: 



n 




n 



Luego, la proporcion muestral p es la estimacion ( P es el estimador) de maxima 
verosimilitud de la proporcion poblacional p, siempre que: 

n n 

X*'* 0, y X x > * n - 

i=i i=i 

Observar que: 

n 

si ^ x t = 0 , entonces, de (*) resulta que el E.M V. de p es p = 0 

i=l 

n 

si ^ jc, = n , entonces, de (*) resulta que el E.M V. de p es p = 1 ' 

i=i 




EJEMPLO 9.5. 

Sea Xj , X n una muestra aleatoria escogida de una poblacion con 

distribucion N(\x t o 2 ). Hallar el estimador de la media p y la varianza a 2 de la 
distribucion, usando el metodo de maxima verosimilitud. 
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SOLUCION. 

La distribucidn de probabilidades de la poblacion normal de parametros p y a 2 
asociada a cada variable aleatoria esta dada por: 



/(*,-, p,o 2 ) = — \=e 
CTV27l 



o 



La funcion de verosimilitud es: 



L(p,a 2 )=[/(x i ,p t a 2 )f = 






1 2 

e 



osfln 



a 

v. / 



)= (2tio 2 ) 



2 V «/2 ^ 2 






Luego, 



L = ln(L^,c 2 ))=-^ln(27io 2 )--^ T ^(jc I - M ) 2 . 



2° « 



Derivando la funcion L con respecto ape igualando a cero da: 



dL 

d\x 





-m) = 0 



X*. 

de donde resulta: p = — = x. 

n 

Luego, la media muestral x es la estimaci6n (X es el estimador) de maxima 
verosimilitud de la media poblacional p. 

Por otro lado, derivando la funcion L con respecto a a 2 e igualando a cero da: 



dL 

do 2 



1 n 



2a 4 ti 



Xu-tf-o 
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~ x) 2 

de donde resulta: a 2 - — = s 2 . 

n 

Luego, la varianza muestral 5 es la estimacidn ( S es el estimador) de maxima 
verosimilitud de a 2 . 

NOTA. Los estimadores de maxima verosimilitud tienen la propiedad de 
invarianza , en el sentido de que si 0 es E.M.V del parametro 0, entonces, 

A. 

cualquier expresion g(0) es E.M.V. de g(0). En el ejemplo 9.5, la varianza 
muestral s es la estimacion de maxima verosimilitud de la varianza poblacional 
a 2 , luego, la desviacion estandar muestral s es la estimacion de maxima 
verosimilitud de la desviacion estandar or. 

EJEMPLO 9.6. 

Para estimar la vida media de un tipo de componente electronica se selecciona 
una muestra aleatoria de 10 unidades, se les somete a prueba y se encuentra que 6 
de ellas siguen funcionando despues de 3,000 horas. Suponiendo que la vida util de 
las componentes es una variable aleatoria T con distribucion exponencial de 
parametro p, estimar la vida media de tales componentes producidas 

SOLUCION. 

Sea p la proporcion poblacional de todas las componentes que siguen funcionando 
despues de 3,000 horas, Entonces, 

p = P[T > 3000] = f ” Pe' p 'rfr = e ' 3000p 

J 3.000 

De donde resulta: p = £~ 3000 P > 

Por otra parte, la estimacion por maxima verosimilitud de la proporcion p es 
(ejemplo 9.4): 

p - p = 6/10. 

Por tanto, utilizando la propiedad de invarianza en p = C -3000 P . resulta: 

B = ^ — ln( p) = — ln(— ) y 3c = ~ = 5.872.85 horas 

3,000 3,000 10 p 
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EJERCICIOS. 



1. De una poblacion /U,p,o 2 ) se escogen dos muestras aleatorias independientes de 
tamanos n x y n 2 . Sean y X 2 , y S? y S \ sus medias y varianzas 
respectivas. 



a) Si X =(niX ] + n 2 X 2 )/(n { + n 2 ) , <,es estadfsticaX un estimador 
insesgado del parametro p.?. 



b) Si 



A 2 _ ( n l ~~ 0-S \ + («2 — 1 )S I 



Mj + /1 2 “ 2 



^es la estadfstica S £ 



insesgado del parametro G~ ?. 



un estimador 
Rp. a) si, b) si. 



2. Si P, y P> son las proporciones de dos muestras de tamanos n ] y n 2 
escogidas de una poblacion Bernoulli B[ 1 , p), verifique que la estadfstica 

A ^1 P| "b^oPo ill , 

P = es un estimador insesgado del parametro p. 



3. Sean X, y X 2 las medias de dos muestras independientes de tamanos n } y n 2 



respectivamente escogidas de una poblacion X de Poisson con parametro X. 



a) Probar que la estadfstica 



0 _ n ] X\ + ^ 2^2 
n \ + n 2 



es un estimador insesgado de 



del parametro X. 

b) Hallar la varianza del estimador. 

Rp. a) E(h) = X . b) Vm = .. 

n \ + n 2 

4 . La duration, en horas, de cierta clase de foco sigue una distribution exponencial 
con media desconocida 0 horas. Se toma una muestra de un solo foco al azar y 
se mide su duration X en horas. Si con X se estima 0, ^se podrfa decir que X es 
un estimador insesgado de 07. 

Rp Si por que X~ Exp( 1/0), entonces. E{X) = ( 1/0)“ 1 = 0 



5. Dos metodos diferentes e independientes dieron lugar a dos estimadores 
insesgados 0j y 0 2 del parametro 0. Las desviaciones estandares de estos 

estimadores son 0.4 y 0.6 respectivamente. Los estimadores son combinados de 
la siguiente manera: 
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0 = r§, + (1 - r)0 2 0 < r < 1 . 

Hallar el valor de r que haga minima la varianza del estimador 0 

Rp. r=0 . 6923 

6. Sea X l ,X 2 ,...,X n una muestra aleatoria de tamano n de una poblacion de 
Bernoulli B(\ y p). De las siguientes estadfsticas: 

Y.xf 

©. =— , ©, =-!=! 

1 n-\ n 

a) ^Cuales son estimadores insesgados del parametro pi. 

b) ^Cual de ellas es de varianza minima?. 

Rp. a) ambos. b) 2do. 

7. Sea X l ,X 2 ,...,X 50 una muestra aleatoria de tamano 50 escogida de una 
poblacidn con distribucion geometrica de parametro p, 0 < p < 1 , 

P[X =x] = p{\-pf, x = 0,1,2,... 

a) Determinar el estimador de maxima verosimilitud para p. 

b) Estimar p. si x, + x 2 + + Jt 50 = 100 . 

Rp a) I/(3c + 1). b) 1/3. 

8. Sea X|,X 2 ,...,X 2 o una muestra aleatoria de tamano 20 escogida de una 
poblacion con distribucion binomial de parametro p, 0 < p < 1 , 

P\X=x\ = C 2 x p x (\- p) 2 ~\ x- 0,1,2 

Determinar el estimador de maxima verosimilitud para p, si en la muestra el 
valor 0 ocurre 4 veces, el valor 1 ocurre 9 veces y el valor 2 ocurre 7 veces. 

Rp. L(p) = 2% 23 (l- p) 17 , /? = 23/40. 

9. El numero de ventas diarias de cierta mercaderfa es una variable aleatoria X de 

Poisson con un promedio de X ventas por dfa. 

a) Si X } , A r 2 ,..., X 50 , son las ventas de 50 dfas, estimar X, por el metodo de 
maxima verosimilitud. 

b) Si en los 50 dias se han hccho 30 ventas de tal mercaderfa, estimar el 

promedio X de ventas diarias. Rp. a) X = 3c. b) 30/50 
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10 . De una poblacion de variable aleatona contmua X se extrae una muestra 
aleatoria X x , X 2 X n , y se define la variable aleatoria Bernoulli: 

Y = j\ si X, >0 

(0 si X, < 0 

a) Usando el metodo de maxima verosimilitud eslimar la proporcidn p de todos 

los valores positivos, esto es, estimar, p - P[X > 0] . 

b) Estime el valor de p si una muestra aleatoria de tamano 80 de X ha dado 64 
valores positivos y 16 valores negativos. 

c) Si X ~ N(\i % 0.04), utilizando a) y b), calcular aproximadamente el valor de p 

Rp a ) p = Y.\’jfn. b)0.8, c)p= 0.168 



11 . El tiempo, en meses, que dura una componente electronica es una variable 
aleatoria T de distribution exponencial con parametro p. Para estimar p se 
prueban 30 componentes y se encuentra que 1 8 fallan antes de los 6 meses 

a) Utilizando el metodo de maxima verosimilitud, estimar la proportion de 
todas las componentes que fallan antes de los 6 meses. 

b) Utilice el resultado de a) para estimar por maxima verosimilitud de p. 

Rp .a) p = 18/30, b)p = l-<T 6p . 0 = -In(!2/30)/6 

12 . La longitud de cierto tipo de objeto producidos por una maquina, puede estar 
por arriba o por abajo de la medida estandar de 2 pulgadas. Suponga que tal 
longitud tiene distribucion normal Mp, 0.0025). 

a) Utilizando el metodo de maxima verosimilitud estime la proporcion p de 
todos los objetos cuya longitud esta por arriba de 2 pulgadas. 

b) Si en una muestra de 1,000 de tales objetos se encontro que 992 tenian 
longitud por arriba de 2 pulgadas, utilizando a) estime la media de la 
longitud de todos los objetos producidos. 

Rp a) p=p. b) p = 0.992 = P[Z > (2 - p)/0.05]. p = 2.1205 

13 . Una maquina produce objetos cuyo peso en gramos tiene distribucion normal 
N( 30, a 2 ), con a desconocido. Los objetos son defectuosos si el peso es menor 
que 26 o mayor que 34 gramos. Para estimar a se pesa un objeto cada vez hasta 
que un defectuoso sea obtenido. Hallar el estimador de maxima verosimilitud de 
a si en un control el primer defectuoso se hallo en la decima prueba. 

Rp 1 - p = P[-4/a < Z £4/a], p = 0.1. a = 2.43 . 
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9.3 Estimacion de parametros por intervalos 

9.3.1 Intervalo de confianza 

Una estimacion de punto no nos dice cuan proximo esta la estimacion al 
parametro que se estima, por lo tanto, no es muy significativa, sin no se ticne 
alguna medida del error que se comcte en la estimacion. Es deseable pues tener 
cierto grado de confianza de que la estimacion de punto se haile dentro de cierta 
variation. 

La estimacion por intervalo (propuesto por J. Neyman en 1937), es la 
estimacidn de un parametro 0 dentro de un intervalo de extremos cerrados [ a y b ], 
donde los numeros a y b se obtienen a partir de la distribucion de la estadfstica 
que estima puntualmente el parametro; y a partir de los valores de la muestra. 

Sea X Xy X 2 ,..., X n una muestra aleatoria de tamano n escogida de una 
poblacion fix , 0), cuyos valores expen me males (o datos) respectivos son 
x lt x 2% ...,x n Sea ademas, la variable aleatoria © = //(X,, X 2 ,..„ X n ) una 
estadfstica para estimar el parametro 0 cuya distribucion de probabilidad sea 
conocida. Si dado el numero 1 - a , y si a partir de la distribucion de © se pueden 
encontrar las variables aleatorias A = //, (X { , X n ) , y 

Z? = // 2 ( X , , X 2 X n ) tales que: 

P[A < 0 < Z?] = 1 -a 

entonces, se dice que el intervalo aleatorio [A, £] es el intervalo estimador del 
parametro 0 con el grado o nivel de confianza de (1 - a) x 100% , o que 0 e [A. B\ 
con probabilidad 1 - a . 

Ademas, si a = //, (jq ,jc 2 y b = H 2 (x , ,jc 2 , , son los valores 
numericos que resultan de sustituir los valores de la muestra en las estadlsticas A y 
B respectivamente, entonces, se dice que el intervalo nunierico [a,b] es el 

intervalo de confianza del (1 - a) x 100% para 0, o que 0 e [ a , b] con nivel o grado 
de confianza de\ (1 - a) x 100% . 

La diferencia, pues, entre los intervalos [A, B] y [a,b], es que el primero es 
un intervalo aleatorio y por lo tanto tiene validez afirmar que la probabilidad 
que contenga al pardmetro 0 es igual a 1 - a . Mientras que el segundo es un 
intervalo numerico fijo, y en este caso, .:o tiene validez afirmar que la 
probabilidad P[a <0 <Z?] = l-a . 
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La interpretation del intervalo de confianza es como sigue: Si a partir de los 
datos de una muestra aleatoria de tamano n, hemos construido el intervalo 
a <8 <6 con grado de confianza, por ejemplo, del 95% para el parametro 0, 
entonces, si se seleccionan repetidamente 100 muestras de tamano n , tendremos 
100 intervalos semejantes al intervalo [a y b], y se conffa que 95 de estos 100 
intervalos contengan el parametro 8. 

La probabilidad 1-a, o el porcentaje (l-a)xl00% es denominado el 
grado ( o nivel) de confianza. Sus valores mas utilizados son 0.95, 98, 0.99 entre 
otros. Al numero a se Ie denomina tambien riesgo de estimation por intervalo. 

A los numeros a y b se les denomina los limites de confianza o de 
tolerancia del parametro 0 . El numero a es el It mite inferior de confianza y el 
numero b es el Imiite superior de confianza. 

Por otra parte, si la estadistica A \ verifica: 

p [ a ^ <e]=i-a 

se concluye que el intervalo es un interxalo de estimation unilateral del 

parametro 0 del (1 - a) x 100% , donde a x es el valor de A } que se obtiene a partir 
de la muestra. 

Similarmente, si la estadistica B\ verifica: 

p[e<fi,]=l-a 

se concluye que el intervalo ] — oo, J es un intervalo de estimation unilateral del 
parametro 0 del (1 - a) x 100% , donde es el valor de B { que se obtiene a partir 
de la muestra. 



9.4 Intervalo de confianza para la media p 

9.4.1 Intervalo de confianza para la media p: 
Varianza a 2 supuesta conocida 

Sea X, , X n una muestra aleatoria de tamano n seleccionada de una 

poblacion normal ( o de cualquier otro tipo, siendo n grande) con media p y 
varianza a 2 supuestamente conocida. 

El mejor estimador puntual del parametro p es la media muestral X 
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Se puede utilizar, entonces, la distribution muestral de la media X para 
determinar el intervalo de confianza del parametro p. 

Si la poblacion es normal /V(p, a 2 ), entonces, la distribution del 

estadistico X es normal /V(p, cr//i) para cualquier valor de n (n > 2 ). 

Si la poblacion no es normal . pero tiene media p y varianza cr I'initas. 
entonces, siempre que el tamafio n de la muestra sea suficientemente grande. 
(n > 30), por el teorema del Kmite central, la distribution de X es 
aproximadamente normal N( p, a 2 In). 

Por tanto, segun sea el caso, la distribution de la variable aleatoria 



Z = 



o yfn 



es ex actamente (o aproximadamente) normal N( 0, 1 ) 

Luego, dado el valor 1— a (o en %), en la distribution de Z, se pueden 
determinar los valores +Z 1 _ ct /2 (figura 9.1) tales que: 



^“^l-a/2 - Z < ^|-a/2 ] - 1 CX. 



Susmuyendo Z — {X — p.)a/V/L se tiene. 



X -p 

^l-a/2 — ft — “ ^l-a/2 

a/Vn 



= 1 — a. 



De donde resulta. 



— a — _ g 

^ ~ Z]-a/2 i — — M — X + ~l-a/2 i — 
yjn ->jn 



= \ - a. 



P[A < p < B] = 1 - a. 



donde A = X - Z |_ a /2 y B = X + z,_ a / 2 c/ son variables alealorias. 

Esto es, si X es estimador de p, se tiene la probabilidad 1-a de que el 
intervalo (aleatorio o estimador) [A y B] contenga al parametro p. 



Luego, 
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Si x es el valor de la media X para una muestra aleatoria de tamano n escogida 
dc una poblacion con varianza a 2 supuesta conocida, el intervalo de confianza del 
(l-a)x100% para p es: 

X — Z\_ a j2 i — — M — ^ ^ ^I-a/2 f — 

El valor Z x _ a j 2 se busca en la tabla normal N( 0,1 ), tal que P[Z < Z \ _ a / 2 ] = 1 - oc/2 . 

La ilustracion, es la figura 9.1, en la que los valores a = x - Zi_ a / 2 cr/>/n y 

^ = x + 2 cr/>/^ son los limites de confianza de p, inferior y superior, 

respectivamente. 




Figura 9.1 Intervalo de estimacion para p (con estadistica Z.) 



Interpretation. Si se seleccionan repetidamente 100 muestras de tamano n, y 
calculamos las medias de cada una de ellas, tendremos 100 intervalos semejantes 
al intervalo [a, b], y se conffa que 95 de estos 100 intervalos contengan el 
parametro p y 5 de los 100 no lo contengan como se muestra en la figura 9 lb. Los 
puntos circulares en el centro de cada intervalo indican la estimacion puntual de p. 
Notar que todos los intervalos son del mismo ancho, ya que este ultimo solo 
depende de Z\. a i 2 una vez que se determina x En la figura 9.1b los intervalos 
correspondientes a las medias x 2 , jc 4 no contienen al parametro p, mientras que el 
resto de los intervalos si contienen al parametro. 
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a M b 



1 

. * 


1 


1 


1 






" \ 
*2 


*3 




• 








*5 


* 




x 6 


*7 


» 











muestra 1 
muestra 2 
muestra 3 
muestra 4 
muestra 5 
muestra 6 
muestra 7 



Fig. 9.1b 



NOTA. (Poblacion finita, raueslreo sin reemplazo) 

Si la muestra aleatoria de tamano n es escogida sin reposition de una 
poblacion finita de tamano N y entonces, si n > 30 , la variable aleatoria: 

Z-- 

a N-n 

V^VA-1 

tiene distribucion aproximadamente normal N( 0,1). Utilizando la distribucion de Z 
se determina el intervalo de confianza de ja . 

Luego, si X es un valor de la media X para una muestra aleatoria de tamano n 
escogida de una poblacion finita de tamano N con varianza a 2 supuesta conocida, 
el intervalo de confianza del (l-a)xl00% para p es: 



^l-a/2 



a In - n _ a //V -a? 



NOTA. (Error estandar) 

Se denomina error estandar de un estimador a la desviacion estdndar del 
estimador. A su valor numerico se denomina error estandar estimado. Por 
ejemplo, el error estandar (E.S.) de la media de una muestra de una poblacion 
infinita (o poblacidn finita con sustitucion) es 



a 
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Si la poblacion es finita de tamano N y el muestreo es sin reposicion el error 
estandar (E.S.) de la media muestral es: 



a 




N-n 
N -l' 



Luego, el intervalo de confianza del (l-a)x 100% para p se puede obtener a 
partir de los Hmites de tolerancia o confianza: 

x + Zi_ a/2 E.S. 



EJEMPLO 9.7. 

Una muestra aleatoria de 100 hogares de una ciudad indica que el promedio 
de los ingresos mensuales es de $500 Encuentre un intervalo de confianza del 95% 
para la media poblacional de los ingresos de todos los hogares de esa ciudad 
Suponga a = $100 . 

SOLUCION. 

Sea X el ingreso familiar mensual de esa ciudad, cuyo promedio p se quiere 
estimar a partir de una muestra aleatoria de tamano n - 100 . La estimacion puntual 
de p es x = 500 . Para el nivel de confianza 1 - a = 0.95 , en la tabla normal 
estandar se encuentra: z,_ a / 2 = Z 0.975 = 1 96 . 

El error estandar de la media X es Qy = ~L = 1 ^ - = 10. 

VA7 vl00 

Los lfmites de tolerancia de p son: 

x + z,_ a/2 a^ =500 + 1 .96(1 0) = 500 + 1 9.6 

Luego, el intervalo de confianza del 95% para p es: [480.4, 519.6] 

Esto es, se tiene una confianza del 95% que el promedio del ingreso 
familiar p de esa ciudad, esta en el intervalo [$480.4, $519.6]. 

NOTA. Muestras diferentes daran diferentes valores de 3c, y por tanto daran 
diferentes intervalos de estimacion de p. Decir que el intervalo de estimacion 
contiene al pardmetro con confianza 95%, equivale a decir que 95 por 100 de los 
intervalos contienen a la media p y que s61o et 5 por 100 no lo contienen. 

EJEMPLO 9.8. 

Un analista de investigacion de mercados escoge una muestra aleatoria de 100 
clientes de un conjunto de 500 clientes de una gran tienda que declararan ingresos 
mayores a $5,000. El encuentra que los clientes de la muestra gastaron en la tienda 



www.FreeLibros.me 



396 



Estadistica 



un promedio de $2500. Si con este valor de la muestra se estima que el gasto 
promedio de la poblaci6n flnita varia de 2446 a 2554, ^que nivel de confian/a se 
utiliz6?. Suponga que la desviacion estandar de la poblacion es o = $300. 

SOLUCION. 



El intervalo de confianza del 1 - a en % para la media p, es la expresion: 

cr 



* ^l-a/2 



a In - n 

^ X + Z '~ a/2 \Tn 

_ __ cr lN-n 300 f 

donde, x = $2,500, o„=- 7 r, = , ,)■ 

x Xvn- 1 Vioov 



L l N ~ n 

n\N - 1 



500-100 



500-1 



= 26.8597 



De p e [2446, 2554], se obtiene 2554 = 2,500 + z,_ a/ 2 (26.8597). 

Luego, ^i-a/ 2 = 2.01, a = 0.0444, 



1 -a =0.9556. 



NOTA. (Error de estimacion) 

Si 3c estima a entonces, el error de la estimacion es el valor numcrico 
|jt - p| (ver figura que sigue). 

error 

■ l - ■ ■ -.i # I 

a X \ x b 

a = X-Z^ aj2 y /7 = J + Zl-a/2 CT x 

El valor minimo del error de estimacion es igual a cero, esto ocurre, cuando x 
estima exactamente a p, 

El valor mdximo del error de estimacidn es igual a Z\- a j2&x' y a 9 ue del 
intervalo de estimaci6n de p. resulta: 

|x-n|<Z,_ a/2 CT^. 

Luego, 

Si 3c estima a p , entonces, se tiene una confianza del (1 - a) x 100% de que el error 
de la estimaci6n no ser& superior a Zi_o/2 c x * donde es el error estandar de la 
media. 
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Por ejemplo, en el ejemplo 9.7 se tiene una confianza del 95% de que al estimar 
ji por S500 el error de la estimacion no sera superior a $19.6. 

Mientras que en el ejemplo 9,8 se tiene una confianza del 95.56% de que al 
estimar \x como $2500 el error de la estimacion no sera superior a $54. 



NOTA. (Tamano de la muestra). 

Se puede determinar que tan grande debe ser el tamano de la muestra, n, de 
manera que si p se estima por x , el error de estimacion no sea mayor que un valor 
dado e. En efecto, el valor de n se obtiene de 

Zl-a/2 a x ^ e 



Entonces, 

Si x estima a p,, entonces, se tiene una confianza del (1-a)xl00% de que el 
error no sera mayor que el valor dado e cuando el tamano de la muestra sea 

(Zi- a/ 2 cr ) 2 

n = 7 

e~ 

Si la poblacion es finita de tamano N y el muestreo es sin sustitucion, el error 
estandares ci^r = (cr/ 4n\j(N -n)/(N -1) y el valor de n se calcula por: 

Z|-a/2^ 2 W 

~ zl a/2 o 2 +e 2 (N-\)' 



Por ejemplo: 

a) En el ejemplo 9.7, se tiene una confianza del 95% de que al estimar la media de 
la poblacion, el error de la estimacion no sera mayor de $18 cuando el tamano n 
de la muestra es: 



(Z]- a / 2 CT) 



(1.96) 2 (100) 2 

(18) 2 



= 1 18.5679 = 1 19. 



b) En el ejemplo 9.8, se tiene una confianza del 97% de que al estimar la media de 
la poblacion, el error de la estimacion no sera mayor de $50 cuando el tamano n 
de la muestra es: 



z l 2 -a/2 a2 +e 2 (N — 1) 



(2.17) 2 (300) 2 (500) 

(2. 17) 2 (300) 2 +(50) 2 (500-1) 



= 126.79 = 127. 
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NOTA. (Estimation del total de la poblacion) 

Si la muestra aleatoria de tamano n. se escoge de una poblacion finita dc 
tamano /V, entonces, 

N 

total de la poblacion : ^ X, - Np . 

i=i 

La estimacion puntual del total Np es Nx . 

El intervalo de confianza del ( (1 - a)100% ) para p es: 

X — Z|_ a / 2® x ~ ^ “ X ^l-a/2^x 

Luego, el intervalo de confianza del ( (1 — a)100% ) para Np es: 

N(x- Zi_ a/2 ^x ) ^Np<N(x + z x _ a , 2 Gx )• 
donde = (p/\fn\j(N -n)/(N - 1) es el error estandar 

Para dar un ejemplo, en el ejemplo 9.8, la estimation puntual del total de 
gastos de la poblacion Np es Nx -5 00( $25 00) = $1,250,000 . 

Ademas, los lfmites de confianza al 95% para el total Np son: 

/V(3c+z,_ a/2 a^) = 500(2500 + 1.96x26.8597) = 1,250,000+26322.506 

Luego, Np e [1,223,677,494, 1,276,322.506) con confianza 95%.. 

Consecuentemente, si el total de la poblacion Np se estima cn $1,250,000. se 
tiene una confianza del 95% de que cl error de la estimacion no sera superior a 
$26322.506. 



9.4.2 Intervalo de confianza para la media jll: 

Varianza a 2 supuesta desconocida 

A) Poblacion no normal 

Si la poblacion no es normal pero el tamano de la muestra es suficientemente 
grande ( n > 30 ), se utiliza la desviacion estandar s de la muestra. como 
estimacion puntual dc la desviacion estandar o dc la poblacion. Entonces, utili/ando 
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el teorema central del lirnite, se concluye que el intervalo de confianza del 
(l-a)xlOO% para p es aproximadamente: 

* ~ Zl-af2°x ^ ^ < X + Z,_ a/2 a * ■ 



donde, el error estandar ct^- = o/Vn se sustituye por el error estandar estimado 

-s/yfn si el muestreo es con o sin sustitucion en una poblacion infinita (con 
sustitucion en una poblacion finita de tamano AO, y se sustituye por 
Cjf = (s/yfc\j(N -n)/(N - 1) si el muestreo es sin sustitucion en una poblacion 
finita de tamano N. 



B) Poblacion normal 

Sea X,, X 2 ,...,X„ una muestra aleatoria de tamano n escogida de una 

poblacion normal N(p, a 2 ) donde la varianza c 2 es supuesta desconocida y sean 
la media y la varianza muestrales respectivas: 




X = 



M 

n 






i=l 

n - 1 



Se sabe que las variables aleatorias: 

X-n (n-l)5 2 



tienen distribuciones respectivas, normal Af(0, 1) y chi-cuadrado con n - 1 grados 
de libertad Ademas Z y V son variables aleatorias mdependientes. Entonces, la 
variable aleatoria: 



T = 




A > 

s 

4~n 



tiene distribucidn /-student con n - 1 grados de libertad, esto es, T ~ t(n - 1) . 

Por tanto, dado el numero 1 - a , en la distribution de probabilidad de T se 
encuentran los numeros ±fi_ a / 2 . n -i (figura 9.2) tales que: 
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A1 sustituir la expresidn de T se obtiene: 




p 


X -|i 

*1-a/2.«-l - - / i— ~ ^l-a/2, n-l 

S/yJn 


= 1-a. 


P[X ~ t l-a/2.n-l $/ <\X< X +0-0/2,*-! 


s/*Jn] = 1-a. 


Luego, 






Si x y s son ia media y la desviacion estandar respectivamente para un valor 
particular x,,x 2 ,...,x n de la muestra aleatoria de tamano n escogida de la 

poblacion normal con varianza cr 2 desconocida, entonces, el intervalo de 
confianza de (l-a)xl00% parapes 

* - h-a/Z.n-1 s/'Jn£]l*x + s/ Vn 



El valor fi_ a / 2 ,„_i se encuentra en la tabla t-student con n - 1 grados de 
libertad tal que P[T < 0- a /2.*-i ] = 1 - a/2 . 

La ilustracion es la figura 9.2, donde, 

a = x- /,_ a/2 . s/4n y b = x + /,_ a/2 $/ 4n 

son los limites de confianza de \ i inferior y superior respectivamente. 




Figura 9.2 Intervalo de estimacidn para |d (con estadistica /). 



EJEMPLO 9.9. 

Los contenidos de una muestra aleatoria de 5 latas de cafe instantaneo de un 
productor han dado los siguientes pesos netos en gramos: 

280, 290, 285, 275, 284. 
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a) Encuentre un intervalo de confianza del 95% para la media de los contenidos de 
todas las latas de cafe del productor. 

b) ^,Con que grado de confianza se estima que el contenido promedio de cafe tenga 
los Ifmites de confianza 277.432 y 288.168?. 

Suponga una distribucion normal. 



a) Sea X el peso de los contenidos de cafe por lata., cuyo promedio p se quiere 
estimar a partir de una muestra aleatoria de tamano n = 5 . Se supone que la 
distribucion de X es normal con desviacion estandar a no conocida. 

Para 1 -a =0.95 y n - 1 = 4 de libertad en la tabla t-student sc encuentra 



De la muestra se obtiene x = 282.8 y s = 5.63 . 

El error estandar de la media X es s/y[5 = 5.63/2.236 = 2.518 . 

Los limites de tolerancia inferior y superior para f4 son: 

x + 'i-a/ 2 . „-i s/Jn = 282.8 + 2.776 x 2.5 1 8 = 282.8 + 6.99 
Luego, el intervalo de confianza del 95% para |i es: [275.81, 289.79] 
b) fie [277.432, 288. 168] con confianza 1 - a . La tolerancia superior es: 
x +^ 1 - 0/2 n - 1 V ^ = 282.8 + 6 - 0/2 4 x 2.5 18 = 288. 1 68 
de donde resulta: 

O-a/ 2.4 =2.132, 1 -a/2 = 0.95, a = 0.10 y l-a = 0.90. 



9.5 Intervalo de confianza para la varianza 

Sea X, , X 2 >'.-,X n una muestra aleatoria de tamano n, escogida de una 
poblacion normal con varianza a 2 , parametro desconocido. 

Un estimador puntual de la varianza a 2 es la varianza muestral 



SOLUCION. 



f l-ct/2.fl-l ~ *0.975.4 ~ 2.776. 



n 




cuyo valor s 2 es la estimation puntual de a 2 
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Para determinar el inlervalo de confianza para la varianza a 2 se puede utilizar 
la estadistica: 

„_(n-\)S 2 

cuya distribucion es chi-cuadrado con n - 1 grados de libertad. esio es. 
X ~ x 2 ( w_ 0 para n>2. 

Dado el grado de confianza 1-a, en la distribucion x 2 (n-\) se pueden 
encontrar los valores Xa/2,«-i y X 2 - a /2.«-i ta ^ es q ue (figura 9.3). 



^IXa/2.*-l - % < X]- a /2.n-\ ] “ ^ “ a - 




2 

Figura. 9.3 Intervalo de confianza de la varianza a 



Sustituyendo X =(n- 1)S 2 /ct 2 resulta: 



(n - 1)5“ ^ 2 ( n -\)S 2 f 

— <o < — =l-a 

Xl-a/2, «-l Xa/2.n-l 



Luego, si s 2 es la varianza de una muesira aleatoria de tamano n seleccionada de 
una poblacidn normal, entonces, el intervalo de confianza de (1 - a)100% para a 2 
es: 

(n-l)i 2 < ^ 2 < (» ~ Qj 2 

Xl-a/2,ri-l Xa/2,n-l 

2 2 

Los valores, Xa/2.*-i y Xi- a /2.n-i se Lallan en la tabla chi-cuadrado con 
n — 1 grados de libertad y con areas acumuladas respectivas de a/2 y 1 — a/2 . 
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EJEMPLO 9.10. 

Una maquina produce piezas metalicas en forma cilindrica. Para estimar la 
variabilidad de los diametros, se toma una muestra aleatoria de 10 piezas 
producidas por la maquina encontrando los siguientes diametros en cenumetros: 

10. 1, 9.7, 10.3, 10.4,9.9, 9.8, 9.9, 10.1, 10.3, 9.9. 

Encuentre un intervalo de confianza del 95% para la varianza de los diametros de 
todas las piezas producidos por la maquina. Suponga que los diametros de las 
piezas se distribuyen segun la normal. 

SOLUCION. 

Con a = 0.05 , = 10 y r = n- 1=9 grados de libertad, en la tabla chi-cuadrado 

se encuentran. 

X a/2. n~l ~ X 0.025. 9 = y X\-aj2.n- 1 = Xo.975.9 = 19.02 . 



De los datos de la muestra resulta s 2 =0.056. Los limites de confianza inferior y 
superior del 95% para la varianza cr 2 son respectivamente: 



2 

Xl-a/2. n-l 



^>= 0 . 0265 , 

19.02 



(»- 1)^ 2 
Xa/2. n-1 



(9X0056) -0.1867 
2.70 



Por lo tanto, el intervalo de confianza del 95% para la varianza a 2 es: 

0.0265 <ct 2 <0.1867. 

Observar que. el intervalo de confianza del 95 % para la desviacion estandar c 

es: 0. 1 628 <cj< 0.432. 



9.6 Intervalo de confianza para la razon de dos 
varianzas 

a 2 A 2 

Sean 5] y S 2 las varianzas de dos muestras aleatorias independientes de 
tamanos ti x y n 2 seleccionadas de dos poblaciones normales respectivas con 
varianzas a 2 y a 2 . 

Un estimador puntual de la razon de las varianzas ct 2 /g\ es la estadistica 



/s\ . 
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Para determinar el intervalo de confianza de o^/a^ se puede utilizar la 
estadfstica Fdefinida por: 

r HR 

sl!°l ' 

que tiene distribution de probabilidad F con grados de liber tad r x = /*, - 1 y 
r 2 = n 2 “ 1 - Esto es, F ~ F(r, , r 2 ) . En efecto, las variables aleaiorias: 

„ (”i -l)Si (n 2 -l)5l 

u 2 * y* 2 

a, a 2 

tienen distribuciones respectivas chi-cuadrado con /t, — 1 y n 2 -\ grados de 
libertad. 

Entonces, la variable aleatoria: 

F= U /(n,-l) _ 5, 2 /g? 

U/(n 2 -l) s|/ CT 2 

tiene distribucidn Fcon grados de libertad q = nj - 1 y r 2 = n 2 - 1 . 

Observar que para obtener tal estadfstica F , no se requiere asumir que las dos 
poblaciones tengan igual promedio 

Dado el grado de confianza 1 - a , en la distribution F ~ F{r ]y r 2 ) se pueden 
encontrar los valores / a / 2 .,,., 2 y fi - a / 2 . r t . r 2 (figura 9.4) tales que: 

PI /a/2. /l-a/2. r, . rj = 1 “ «• 




2 / 2 

Figura. 9.4. Intervalo de confianza de la varianza CT, /CT 2 
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Sustituyendo F = (5, 2 /of )/{Sl / a\) y dado que: 



resulta. 



Luego, 



fa/2, r 2 , r x 



f\ -a/2, r, . 



y /l-a/2. r 2 , r, 



1 /< 



2 £2 
a l ^ *^1 



~ 2 fa/2, r 2 .r } — 2 ~ £2 f^~ a l 2. r 2 .r, 



a/2 .r,,r 2 



= 1 - a. 



Si 5j 2 y s 2 son ^ as varianzas de dos muestras aleatorias independientes de 
tamanos y seleccionadas respectivamente de dos poblaciones normales, 
entonces, el interval o de confianza de (1 - a) x 100% para a 2 jo\ es: 



*2 

st 



2-f n < -—L < — fi „ 

^2 •* a/2, r 2 , Tj 2 ~~ ^2 ** l-ct/2. r 2 , rj 



EJEMPLO 9.11. 

Se quiere comparar la variabilidad de todas las ventas mensuales de una 
compania A con la variabilidad de su competidora la compania B. Se sabe que todas 
las ventas de A y de B se distribuyen normalmente. Se han tornado dos muestras 
aleatorias de ventas; una de 8 meses de A y otra de 6 meses de B obteniendose 
las siguientes ventas: 

Muestra de A 17, 23, 21, 18, 22, 20, 21, 19. 

Muestra de B 13, 16, 14, 12, 15, 14. 

Mediante un intervalo de confianza del 95% para a 2 /o 2 . /,Se puede concluir que 
son iguales las varianzas de todas las ventas de las compamas A y B?. 

SOLUCION. 

Sean X, Y las variables aleatorias que representan las ventas de A y de B 
respectivamente. Se supone que las distribuciones de X, Y son normales. 

Con a = 0.05 , y grados de libertad r } = n x - 1 = 7 y r 2 =n 2 - 1 = 5 en la 
tabla F se encuentran: 

f l~a/2, rj, r, = f 0.915,1,5 =6.85, y, /i- a /2. r 2 .r, = /o.975.5.7 =5.29, 
entonces, f a j 2 = 1 J /i_ a / 2 , r, . r 2 ~ V / 0 . 975 . 7.5 = 1/6. 85 = 0. 146 . 

De los datos de la muestra resultan 5, 2 = 4.13 y s 2 = 2 . 
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Los lfmites de confianza del 95% para af/o 2 inferior y superior son 
respectivamente: 

= (0- 146) = 0.30 1 49. 

s 2 1 

^-/.-a/ 2.,,,, = ~t~(5-29) = 10.9239. 

*2 1 

2 / 2 

Por lo tanto, el intervalo de confianza del 95% para la varianza a, / a 2 es: 

0.30149 <oi7<^ ^10.9239. 

Dado que el cociente a 2 /a 2 =le [0.30149, 10.9239], se concluye que no hay 
diferencias significativas entre las varianzas de todas las ventas de A y B. 



9.7 Intervalo de confianza para la diferencia 
entre dos medias 

9.7.1 Intervalo de confianza para la diferencia entre dos 
medias: Varianzas a, 2 y a 2 supuestas conocidas 

Sean X x y X 2 las medias de dos muestras aleatorias independientes de 
tamanos n } y n 2 seleccionadas respectivamente de dos poblaciones con medias 
Mi y M 2 y varianzas oj* y a 2 supuestas conocidas. 

Un estimador puntual de la diferencia de medias pj -p 2 es la estadistica 
X i — X 2 cuyo valor x x -x 2 es la estimation puntual. 

Si las dos poblaciones son normales, entonces, X x y X 2 tienen distribuciones 
respectivas normal /V(pj , g] /n x ) y N(p 2 , a \l n i) (P ara n } >2, y n 2 > 2 ). En 
consecuencia, la estadistica X x -X 2 dene distribucion normal 
N((i, -|u 2 ,o 2 /n, +al/n 2 ). 
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Si las dos poblaciones no son normales pero n x y n 2 son suficientemente 
grandes ( n x > 30 y n 2 ^ 30 ), entonces, la estadfstica X x -X 2 es 
aproximadamente normal N(\x x -H 2 » 0 ?A*i + c \l n i)- 
Por tanto, segun sea el caso, la variable aleatoria: 

, x,-x 2 -(m- M2 ) 

■Jcf/n, + ~v\Jn 2 

tiene distribucion exactamente o aproximadamente normal /V(0.1). 




j intervalo de (J.,-p 2 | 

Figura 9.5: Intervalo de estimation de n, - p 2 

Dado el grado de confianza 1 - a , en la distribucion de Z se puede encontrar el 
valor z 0 = Z\- a j 2 tal que P[-z 0 <Z < z 0 ] = 1-a (fig- 9.5) 

Sustituyendo Z = (Z, ~ S 2 )Jcs^ ^ donde ^ = V°? / w i + a 2 A , 2 
y operando, resulta, 

<m -H2 ^(*1 _X 2) + ^0 c x | -xJ =1_Ct - 

Luego, 

Si x { y son ^ as medias que resultan de dos muestras independientes de tamanos 

n x y n 2 escogidas respectivamente de dos poblaciones con varianzas a, 2 y a 2 
supuestas conocidas, entonces, el intervalo de confianza del (l-a)100% de 
Pi -p 2 es: 

(*i -x 2 )-z 0 -Jaf/ni+al/n 2 Sji, -jr 2 < (*, ~x 2 )+ z 0 ^f/n 1 ~+^Jn 2 
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El valor z 0 = Z\- a j 2 se obtiene de la tabla normal ?V(0,1) de manera quc 
P[Z < Z |_ a/2 ] = 1 - ct/2 . 

La ilustracion es la figura 9.5, donde, 

a = (x , -x 2 )~ Zo-Jcf/ri] ~^o\Jn 2 y b = (x , -x 2 ) + z 0 -^Jn x Tc\/th 
son los limiles de confianza de \i x — p 2 , inferior y superior respectivamente. 



EJEMPLO 9.12. 

Un agente de compras de una companfa esta tratando de decidir si comparar la 
marca A o la maraca B de cierto tipo de focos ahorradores de energia. Para estimar 
la diferencia entre las dos marcas se lleva a cabo un experimento con dos muestras 
aleatorias independientes de 10 focos de cada marca resultando las medias de vida 
util respectivas de 1,230 horas y 1,190 horas Estimar la verdadera diferencia de las 
dos medias de vida util, mediante un intervalo de confianza del 95%. ^Es acertada 
la decision del agente si adquiere cualquiera de las dos marcas? 

Suponga que las dos poblaciones tienen distribution normal con desviaciones 
estandares respectivas de 120 y 60 horas. 

SOLUCION. 

La estimation puntual de pj -p 2 es la diferencia de las medias muestrales 



3q -5c 2 =1230-1 190 = 40. 



Error est&idar : 



■fHN 



«W 2 + mi ,42.43. 



10 10 

Para el grado de confianza del 95% se encuentra z 0 = ^i _ a /2 = ^0975 
Los lfmites de confianza inferior y superior respectivamente de p, — 

(l, -jt2)+Zo CT ?,-i, =40 + 1.96(42.43) = 40 + 83. 1628 



= 1.96 

[X 2 son 



Luego, el intervalo de confianza aproximado del 95% para — \± 2 es 

-43.16 < pj -p 2 <123.16. 

Dado que p.j — p 2 = 0e[— 43.16, 123.16], se concluye que pj y que no 
hay diferencias significativas entre las medias de las vidas utiles de los objetos de 
marcas A y B Por tanto, el agente de compras puede adquirir cualquiera de las dos. 
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9.7.2 Intervalo de confianza para la diferencia entre dos 
medias: Varianzas af y a* supuestas desconocidas 

A) Poblaciones no normales 

Si jc, y x 2 son los valores de las medias de dos muestras aleatorias 
independientes de tamanos n, y ti 2 seleccionadas respectivamente de dos 

poblaciones cuyas distribuciones son no normales con varianzas CTj y a 2 
supuestas desconocidas, entonces, siempre que los tamanos de las muestras sean 
grandes ( «, > 30 y n 2 >30), los pardmetros a, y a 2 se estiman puntualmente 
por j, y i 2 . El intervalo de confianza del (l-a)xl00% para p, -p 2 es 

entonces: 

(*1 -^2)-ZoV^ 2 /"l + ^/«2 “Hz ^(*1 ~^2) + Zoa/^| 2 Ai + ~ S ll n 2- 

B) Poblaciones normales 

Sean X, y X 2 las medias y S 2 y S 2 las varianzas de dos muestras 
aleatorias independientes de tamanos n { y n 2 respectivamente seleccionadas de 
dos poblaciones normales con varianzas a, 2 y Oj supuestas desconocidas. 



Bl) Varianzas supuestas iguales: a , 2 =a\=o 2 

En este caso, las variables aleatorias, 

, (x,-X 2 )-<M,-H 2 > .. „ _ («, -l)5j 2 +(n 2 -l)i| 

^ f » y* ' ■ ~ 

ctyl/zq + l/n 2 a 



tienen respectivamente distribucidn normal N(0,1), y chi-cuadrado con grados de 
libertad. n } +n 2 - 2 . Ademds, se comprueba que ambas U y V son independientes. 
Entonces, la variable aleatoria: 



T = 



U 



£ 



\/ 

-TAZ2 - 



2 



(y.-xJ-Qn-fe) 

l(n,-l)S 1 2 +( n 2 -l)S* l' rn 

V «,+«2-2 [n, nj «2 



tiene distribucidn /-student con nj +n 2 -2 grados de libertad. 
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La varianza comun 5^ definida poi : 

-2 (»| -l)Sj 2 +(« 2 -0^2 

n \ +n 2 

es un estimador insesgado de la varianza conuin o 2 . 

Dado el grado de confianza 1 — a en la distribucion f(/i, + n 2 - 2) se puede 

encontrar el valor = ^ 1 _ a ^ 2 . ni+ ^ 2 _2 (figura9.6), tal que 



P[-t 0 <T <t 0 ] = l-a. 




1 — f- 1 X-X 2 

a Xj-x 2 b 

| intervalo de p,-p2 | 

Figura 9.6: Intervalo de estimation de pj -p 2 



Sustituyendo la expresion de T \ y operando rcsulta, 

/|( X, - X 2 ) - +S 2 /n 2 < Ml -^ 2 <(X 1 -X 2 ) + + ^c/ n 2 



= 1-CL 



Luego. 

Si Xi y x 2 son las medias que resultan de dos niuestras mdependientes de tamanos 
n \ y n 2 escogidas respectivamente de dos poblaciones normales con varianzas 
a, y a 2 supuestas desconocidas e iguales, entonces, el intervalo de confianza del 
(l-a)xl00% de ~p 2 es: 

(*i -x 2 )-t 0 ^f/n^sfjn 2 <|a, -|i 2 <(I, ~J 2 ) + t (] ,js^/n ] +Jffti , 

El valor / 0 =/|_ ct / 2 . f i 1 + w ,- 2 ’ se cncuentra en la tabla t-studcnt con +/z 2 -2 
grados de libertad tal que P[T < ?\- a / 2 .tL+rL ~2 1 = 1 — cx/2 . 
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La ilustracion es la figura 9.6, donde; 

a = (x, -x 2 )-t 0 -pf/n, +s*/n 2 y b = (x t -x 2 ) + t 0 Js^ /n, + s* /n 2 
son los limiies de confianza de p, - p 2 » inferior y superior respectivamente. 



B2) Varianzas supuestas distintas: Of ^ G \ 

Hn este caso, la estadfslica, 

^ (Xi-X 2 )-(^1 -n 2 ) 

a/^i ? /«i + Wi "2 



tiene distribucion /-student con r grados de libertad, siendo. 




ri] — 1 n 2 — 1 

Dado que r rara vez es un entero, se redondea al entero mas cercano. 



El inter valo de confianza del (l-a)xlOO% para p, -p 2 es: 
C*i - x 2 )-t^ 2 r ^, 2 /n, + f?/n 2 <H,-|i 2 < - x 2 )+t l _ aJ% r y[$ 



fa+gfa- 



EJEMPLO 9.13. 

El encargado de compras de una cadena de restaurantes tiene que escoger entre 
dos variedades de arroz A y B Selecciona dos muestras aleatorias independientes 
de 10 bolsas de arroz de un kilo de cada tipo de arroz y encuentra los siguientes 
porcentajes de granos quebrados por kilo: 

A: 6, 5, 6, 7, 4, 7. 6, 4, 3, 6. 

B: 7, 6, 7, 9. 5, 8, 7, 6, 10,8. 

Estimar mediante un intervalo de confianza del 95% la diferencia promedio de 
porcentajes de granos quebrados por kilos de arroz de las dos variedades. ^.Se 
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puede aceptar quc no hay diferencias significativas entre las dos mcdias 
poblacionales?. 

Suponga que los porcentajes de granos quebrados por kilo en cada varied ad 
se distribuyen normalmente con la misma varianza. 

SOLUCION. 

Sean X x y X 2 las poblaciones de porcentajes de granos quebrados por kilo. Se 
supone que las poblaciones son normales con varianzas dcsconocidas supuestas 
iguales. 

De las muestras (utilizando el paquete MCEST) se obtiene 

n x =10, jc, =5.4, s j =1.35, n 2 =10, x 2 =7.3, s 2 =1.49, 



. 2 («, -l)i, 2 +(«, - l)f| 9(1. 35) z +9(1.49)’ 

— 



> 2 , + tin - 2 



10 + 10-2 



= 2.0213. 



El error estandar de la diferencia de medias es: 






2.02,3 +1 ffil3 = 06358 _ 



10 



10 



Para 1 - a =0.95 y 18 grados de libertad se halla: r 097 5 lg =2.101. 

Los Ifmites de confianza inferior y superior del 95% para p 2 “ Mi son: 

(x 2 - 1 , )+ r,_ a/2 . ni + „ 2 . 2 C = (7.3 -5.4) + 2. 10 1(0.6358) = 1.9+1.336. 

Luego, el intervalo de confianza del 95% para p 2 -pi cs 

0.564 <p 2 “Mi <3.236 

Dado que p 2 “Mi n0 pertenece al intervalo de confianza, no se debe aceptar 
que p, =p 2 - 



EJEMPLO 9.14. 

Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y 
mujcres para realizar determinada tarea Las experiencias anteriores indican que la 
distribution de tiempos tanto para hombres como para mujeres es normal con 
varianzas diferentes. Una muestra aleatona de 9 hombres y 8 mujeres han dado los 
siguientes tiempos en minutos: 

Hombres: 12, 28. 10, 25. 24, 19, 22, 33. 17 
Mujeres: 16, 20, 16, 20, 16. 17, 15, 21. 
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Mediante un intervalo de confianza del 95% para la verdadera diferencia de los 
promedios de tiempos de hombres y mujeres, £se puede concluir que los hombres 
emplean mayor tiempo que las mujeres para hacer la tarea?. 

SOLUCION. 

Sean X, y X 2 las variables aleatorias que representan los tiempos 

empleados por los hombres y las mujeres respectivamente. 

De las muestras dadas (utilizando el paquete MCEST) se obtiene: 

n { =9, x x =21.111, s x =7.4237, 

n 2 ~ 8, *2 =17.625, s 2 =2.326. 

La diferencia de las medias muestrales es 

x } -x 2 =21.111-17.625 = 3.486. 

El error estandar de la diferencia de medias es 




El numero de grados de libertad es 

-i2 






sfk+Zfa] [ (7 ,42)V9 + (2.33)V8f 



^7«,f fe/W 


r 


(7.42) 2 /9 2 


(2.33) 2 /8 2 



-9.73 = 10 



n x — 1 - 1 



9-1 



8-1 



Para 1 - a = 0.95 y r = 10 grados de libertad se tiene t 0 975 ]0 = 2.228 . 

Los limites de confianza inferior y superior aproximados de \i { - \i 2 son 

(x, -x 2 ) + = 3.486 + 2.228x2.61 = 3.486 + 5.815. 

Luego, el intervalo de confianza del 95 por 100 para p, - p 2 es 

-2.329 < pi -p 2 <9.301 

Dado que p, -p 2 =0e [-2.329, 9.301J podemos concluir que \i x =p 2 , por tanto, 
los tiempos promedios de hombres y mujeres son iguales. 

Se recomienda al lector resolver este problema usando un paquete de computo, 
por ejemplo el MCEST. 
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9.8 Intervalo de confianza para la diferencia entre 
dos medias con observaciones pareadas 

Sea (XpK,), (X 2 ,Y 2 ( X n ,Y n ) una muestra aleatoria de n datos 
aparejados, donde las muestras X x , X 2 ,..., X n , e Y x , K 2 ,...,K W , correlacionadas 
son seleccionadas respectivamente de dos poblaciones normales X ~ y 

Y~N(h 2 ,c 2 2 ). 

Podemos concebir estas n diferencias: D ] =X x -Y ] , D 2 = X 2 - Y 2 

D„ = X n ~Y n como una muestra aleatoria seleccionada de una poblacion de 
diferencias D = X-Y cuya distribucion es normal /V(p Dt a^), con media 
Pd = Pi “P 2 y varianza g 2 d =a, 2 + a 2 - 2cov(X,K) . 

El estimador insesgado de \x D = pij — p, 2 es la estadistica: 

_ 2 > 

D =-^ = — =— — — = X -Y 

n n n n 

n 

_ I “i 

cuyo valor d = — es la estimation insesgada de pi D . 

n 

Si cs 2 d es conocida, la estadistica D tiene distribucion normal 
N([i D ,o 2 D /n ) . Consecuentemente la estadistica: 

D “(Pi -P 2 ) 

tiene distribucion normal N( 0,1). Esta estadistica se utiliza para determinar el 
intervalo e confianza de \x D =P! -p 2 con varianza conocida. 

Luego, si d es la media de las diferencias de n datos pareados escogidos de una 
distribucion normal con desviacion estandar ct d supuesta conocida, entonces, el 
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intervalo de confianza del (l-a)xlOO% para la diferencia de medias 
p D =Pi — p 2 es laexpresion: 

d - Z^a/2^ D 1 <H, -H 2 < d + Z|-a/2 CT »/ Vn 
siendo C|_ a ./ 2 un valor que se encuentra en la tabla normal N((0, 1 ), tal que 

P[Z<Z\- an ] = \-a.l2 

2 

Por otra parte, si la varianza <3 D es desconocida , el estimador puntual de esta 
varianza, es la estadistica: 

c 2 i=l 

^£> “ ; 

« - 1 

cuyo valor, 

2>, - J > 2 'Zdf-nid) 2 

- T r t 



es la estimation de ■ Ademas se verifica que la estadistica 

r _ P~(Mi ~H2 ) 

S D /yfn 

tiene distribution t-student con n-1 grados de libertad Esta estadfstica se usa 
para determinar el intervalo de confianza de p D = p, - p 2 
Luego, 

Si d y s d son la media y la desviacion estandar de una muestra aleatona de n 
diferencias de pares de datos de una poblacion normal con varianza <j 2 d supuesta 
desconocida , entonces el intervalo de confianza del n~a)xlOO% para 
Pd =Pi “P2 es 

<*-* 1 - 0 / 2 ,#,-! Jj/Vn <Hi -H 2 ^d + r,_ o/2 _„_, S d /^ 

El valor fi_ a / 2 .„-i se encuentra en la tabla t-student con n - 1 grados de 
libertad. tal que: P[T < /,_ a y 2 n _i ] = 1 -cx/2 . 
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EJEMPLO 9.15. 

En estudios generales ciencias de la PUCP se han escogido 12 pares de alumnos 
sobre la base de la similaridad se sus rendimientos. A un alumno de cada par le fue 
ensenado el curso de calculo I por el metodo tradicional (X) y al otro alumno por el 
metodo de talleres (T). Estos alumnos dieron una prueba con los siguientes 
resultados: 



Par de Alumnos 


1 


2 


3 


4 


5 


6 


7 


8 


9 


10 


11 


12 


Tradicional (X f ) 


14 


15 


12 


13 


15 


11 


10 


15 


15 


16 


14 


8 


Talleres (T,) 


12 


16 


12 


11 


12 


09 


07 


13 


14 


15 


12 


10 


Dfirerencias d f 


2 


-1 


0 


2 


3 


2 


3 


2 


1 


1 


2 


-2 




4 


1 


0 


4 


9 


4 


9 


4 


1 


1 


4 


4 



Mediante un intervalo de confianza del 95%, determinar si los dos metodos son 
igualmente efectivos. Suponga distribution normal. 

SOLUCION. 

Haciendo d t = X i — Y { , i = 1, 2, - - • 1 2 , se obtiene. 



12 

i", 



15 



d=-^l = — =1.25. 

12 12 



^Jd. d) 2_ w ^|2 | 45 _ i2(l,25) 2 

I n - 1 V n — 1 V 12-1 



1.545 



Error estandar: s d /yfn = 1 .545/yf\2 = 0.446. 

Para 1 - a = 0.95 y n- 1 = 11 grados de libertad se determina 

6-a/2,n-l = ^0.975, 1 1 =2.201. 

Los limites de confianza para p D = p, -|i 2 son * 



d + 'i-a/ 2 . „-i Sd /'fn =1-25 + 2..20 1 x 0.446 = 1.25 + 0.981 6 



Por tanto, Pd=Pi~P2 g [0.268, 2.232] con confianza del 95% 
Como Og [0.268, 0.232], entonces, p, * p 2 * aun mas » Pi > P 2 • 
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9.9 Intervalo de confianza para una proporcion 

Sea X,,X 2 ,..., X„ una muestra aleatona de tamano n escogida de una 
poblacion de Bernoulli' B(\,p). cuyo parametro pcs la prpporcion de exitos 
en la poblacion. En la muesira cada X , = 1, si hay exito con probabilidad p , y 

cada X, = 0 , si no hay exito con probabilidad 1 - p. 

El estimador puntual del parametro p es la estadfstica P , proporcion de exitos 
er la muestra definida por: 



n 




n n 



donde la variable aleatoria X = ^ ^ X, es el numero de exitos en la muestra y 
cuya distribucion es Binomial B(n , p). 

El valor p = x/n que se obtiene de P para una muestra especifica, es la 
estimacion puntual del parametro p. 

La estadfstica P tiene: 

media = E(P) = p 

y varianza = Var(P) = p( 1 - p)/n , 

Ademas, si el tamano n de la muestra, es suficientemente grande (n > 30), por el 
tcorema central del lfmite, la distribucion de probabilidad de la proporcion muestral 
P es aproximadamente la normal, con media p , varianza p( 1 - p)ln. 

Luego, la variable aleatoria eslandarizada 

v- p-p 

tiene distribucion aproximadamente N( 0,1). 

Se puede usar la distribucion de Z para determinar un intervalo de confianza del 
parametro p . 

Dado el grado de confianza 1 - a , podemos encontrar en la distribucion de Z 
el valor z,.^ tal que (figure 9.7) P[~z ,_ a/2 S Z < z,_ a y 2 ] = 1 - a. . 

Sustituyendo la expresion de Z resulta: 
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P[-*l-a/2 * ~f= == ^ Zl-a/2 1 = • “ “ 

■Jp( i - pm 

PIP ~ Z\- a / 2 jp( l - P)/ n <P<P + Zi-ajtJpQ- p)!n\ = 1 - a. 



El error estandar o- =^1 p( 1 - p)/n se estima por d- =yj p( 1 - p)/n . 
Luego, 



Si p es la proporcidn de exitos en una muestra aleatoria de tamano n , entonces, el 
intervalo de confianza del (1 - a) x 100% para p es: 



P ~ ^I-a/2 






zzl< 



<p<p + z u 



a/2^ 



/ 7(1 - / 7 ) 



El valor Z\_ a j 2 se halla en la tabla normal /V(0,1), de manera que 



P[Z<z i . aJ2 ] = l-a/2. 



La ilustracion es la figura 9.7, donde 

a = p-z l - aJ2 i]pO-p)/n y p + 2,_ a/2 VpO “ P)/« 
son los lfmites de confianza de /?, inferior y superior respectivamente. 




intervalo de p 



Figura 9.7: Intervalo de estimation del (1 - a) x 100% para p 



EJEMPLO 9.16. 

Una encuestadora utilize una muestra aleatoria de 600 electores que acaban de 
votar y encontro que 240 votaron a favor del candidato A. 
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a) Estimar el porcentaje de electores a favor de A en toda la poblacion, utilizando 
un intervalo de confianza del 95%. 

b) Si la proporcion a favor del candidato A se estima en 40%, ^cuanto es el error 
maximo de la estimacion, si se quiere tener una confianza del 98%?. 

c) Si con la misma muestra la proporcion a favor de B se estima en 38% con una 
confianza del 98% que el error no es mayor a 4.62%, ^Se puede proclamar a A 
como ganador de las elecciones?. 

d) ^Que tan grande se requiere que sea la muestra si se desea tener una confianza 
del 94% de que el error de estimacion de p no sea superior a 2%?. 

SOLUCION. 

a) La estimacion puntual de la proporcion p a favor de A en la poblacion, es la 
proporcion a su favor en la muestra de n - 600 electores; esto es. 
p = 240/600 = 0.40 
La estimacion del error estandar es: 



Luego, el intervalo de confianza del 95% para p es de 0.3608 a 0.4392 Es 
decir, p g [36.08%, 43.92%] con confianza del 95%. 

b) Si p se estima por p se tiene una confianza del (1 - a) x 100% que el error de 



Luego, si con n = 600 , p se estima en 0.40, se tiene una confianza del 
98% de que el error de la estimacion a favor de A no sera mayor a 4.66%. 

c) El intervalo de confianza del 98% a favor de A es [35.34%, 44.66%]. 

El intervalo de confianza del 98% a favor de B es [33.38%, 42.62%]. 

Dado que la interseccion de los intervalos no es vacio, no se puede 
proclamar a A como ganador. En este caso se dice que hay un empate tecnico 




Para 1 - a = 0.95 se tiene z ^ a ]2 = Zo .975 = 1 -96 . 

Los Ifmites de confianza de p , inferior y superior, son respectivamente 



P + Z\-*fiQp = 0.40 + 1 .96(0.02) = 0.40 + 0.0392 



la estimacion no sera mayor que z^ a j 2 ^ P0 ~ P)/n 
Para una confianza del 98%, Z\- a ( 2 = Z 0.99 = 2.33 , y 



2| -aji'JW-W" = 2.33 a /(0.40)(0.60)/600 = 0.0466. 



www.FreeLibros.me 



420 



Estadistica 



d) Dado el error maximo e de la estimacion de p con confianza de ( 1 - a) x 100% 
el tamano n de la muestra, se puede determinar en dos formas: 

dl) Si se tiene el valor de p (de una muestra preliminar o piloio ). el error 
maximo de estimacion de p es: 

e =Zt- a ny]p( ] ~ P)/ n 



de donde resulta; 



n = 



(^l-g/2 ) P } 



En nuestro ejemplo p- 0.60. Para el nivel de confianza l -a =0.94. se 



obtiene Z x _ a , 2 = Z 091 = 1.88 . Luego, se tiene una confianza del 94% que el 
error a! estimar p no sera mayor que 0.02 si el tamano de la muestra es 



n =(1.88) 2 (0.6)(0.4)/(0.02) 2 = 2120.64s 2121 . 



d2) Si no se tiene el valor p % entonces, se puede usar el valor maximo 

p-q = 1/2. 

En efecto, pxq = p(\-p) = -(p- 1/2) 2 + 1/4 < 1 /4 



Luego, de e -Z\^ ui2 ^p{\ - p)fn , resulta, n = q/ ? 2 * • 

4e~ 

Para 1 -a = 0.94, z k _ u j 2 = -o .97 =1-88. Luego, se tiene una confianza de; 

94% que el error al estimar p no sera mayor de 0.02 si el tamano de la 
muestra es, 

h =(1.88) 2 /(4x(0.02) 2 )= 2209. 



NOTA. Si el muestreo es sin reemplazo en una poblacion (Bernoulli de valores 0 
y 1) finita de tamano ,V, entonces el error estandar de P es 
Op = {pq/ifn\j(N — «)/((V - 1) El error estandar estimado de P es: 

- _ I pQ-p) In-h 

P V n \N - r 

y el valor de n se calcula por 

d-afipqN 

n = —. — r 

Zi-a/iPq+e (N-\) 

Si se desconoce ,p, se puede utilizar el valor p= 0.5. 



www.FreeLibros.me 



Estimat ion de parametros 



421 



EJEMPLO 9.17. 

Una empresa va a hacer un estudio de mercado antes de lanzar un nuevo 
producto hacia una poblacion de 30,000 consumidores. 

a) iQuc tamano de muestra debera escoger si quiere tcner una confianza del 95% 
de que error de la estimacion de la proporcion a favor del producto no sea 
superior al 4%?. 

b) Si con el tamano de la muestra calculado en a) se utiliza p = 0.7 como 
estimacion de la proporcion de todos los consumidores que prefieren su 
producto. ^.Que grado de confianza utilizo si estimo de 19,783 a 22,217 el total 
de consumidores de la poblacion que prefieren su producto? 

SOLUCION. 

a) Para 1 - a =0.95, resulta Zj_ a / 2 = Z 0.975 = 1.96 . 

Utilizando el valor p(\~p) = \f 4 y N = 30,000 se tienc: 



M-a/2 P<1 N 



(1 .96) “(30,000) 



= 588.49 = 589 



(1.96) 2 +4(0.04) 2 (30,000-1) 
b) El intervalo 19,783 < Np < 22,217 , resulta dc N(p+ Zi_ a / 2 ^p ) » donde 

Op =V(p0-P)/«)((/V-«)/( N-l)) . 

Para n = 589, N = 30,000 y ~p = 0.70 , se obticne =0.0187. 



De 22,21 7 = N(p ± Z]- a / 2 Gp ) resulta: c.i_ a /2=2.17, l-a/2 = 0.985. 

a =0.03, y 1 -a =0.97 



9.10 Intervalo de confianza para la diferencia entre 
dos proporciones 

Sean P x y P 2 las proporciones de exitos de dos muestras aleatorias 
independientes de tamanos w, y n 2 seleccionadas respectivamente de dos 
poblaciones de Bernoulli' B( 1, p x ) y B( 1, p 2 ) , donde p x y p 2 son los respectivos 
parametros proporciones de exitos. 

La estimacion puntual de P\~Pi es la estadistica P\-P 2 cuyo valor es 
P\ ~ Pi • 
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Si n, y n 2 son suficientemente grandes, P x y P 2 tienen distribuciones 
aproximadamente normales respectivas N( p x , p x (1 - p, )/n, ) y 
N ( p 2 , p 2 (1 — P2)l n 2) • P° r lanto, por la propiedad reproductiva de la normal la 
estadistica P x - P 2 tendrd distribution aproximadamente normal con media: 



= £(P, -P 2 )=p, -p 2 , 

y con varianza 

= V ° r(/> ' “ ^ ) = Pl (1 " P ' >/"l + P 2 O “ Pi )/«2 • 

Por consiguiente, 

2 _ ^ ~ ^2 ~~ (Pi ~~ P2) 

VP»9»/"l + P2<hl n l 



tendra aistnbucion aproximadamente normal /V(0,1), siendo <7i=l-Pi y 
= 1 ~ P 2 - ^ sta distribucidn se utiliza para determinar el intervalo de confianza de 



P\ ~ Pi ■ 

Dado el grado de confianza 1 - a , en la distribucion de Z, se puede encontrar el 
valor z 0 = Z\-aji tal que 

Pl-Zo £ Z <z 0 ] = l-a. 



Sustituyendo el valor de Z y luego de hacer operaciones convenientes se obtiene 



| ”1 "2 V ”1 n 2 



= l-a. 



El error estandar: 

se estima por: 
Luego, 






a p,-A 




Si Pi y P 2 son las proporciones de 6xitos en dos muestras aleatorias 
independientes de tamanos n } y n 2 respect ivamcnte, entonces, el intervalo de 
confianza del (1 - a) x 100% de p l — p 2 es 

(pi -PlhZlrvftPto-P* - Pi ~Pl -(Pl -Plh^a/l^p,-^ 
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El valor Zj_ a / 2 se halla en la tabla normal /V(0,1), de manera que 
P[Z < Z\- a j 2 1 = 1 — ot/2 . 



EJEMPLO 9.18. 

Un fabricante afirma que su nuevo producto de consumo popular prefieren mas 
los hombres que las mujeres. Para comprobar tal afirmacion, se toma una muestra 
aleatoria de 250 hombres y otra de 200 mujeres, y se encuentra que 175 hombres y 
120 mujeres prefieren el nuevo producto. Utilizando un intervalo de confianza del 
95% para la verdadera diferencia de proporciones de preferencias entre los 
hombres y las mujeres, ^se puede concluir que el fabricante del nuevo producto 
tiene la razon?. 

SOLUCION. 

De los dates del problema se obtiene: 

p, = 1 75/250 = 0.7, p 2 = 1 20/200 = 0.6 , 



p, -p 2 =0.7 -0.6 = 0.1 



La estimacion puntual del parametro p x — p 2 , es la diferencia de proporciones 
muestrales pj - p 2 = 0.1 

4 El error estandar de la diferencia de proporciones, P } - P 2 es: 

p '~ p '■ \ n , n 2 V 250 200 

Para 1 - a = 0.95, se tiene Zi _ a /2 = Zo 97 s = L96 
Los linutes de tolerancia para p ] — p 2 son: 

(pi -P2)+2|-a/2CTp,.p 2 =0.1 + 1.96(0.045) = 0.1 +0.0882. 

En consecuencia, el intervalo de confianza del 95% para pj - p 2 es 

0.01 18 < p, -p 2 <0.1882. 

Dado que el intervalo resultante no contiene el valor cero, debemos concluir que 
las proporciones de preferencias en la poblacion son diferentes, esto es, p ] * p 2 y 
dado que el intervalo contiene valores positivos, hay razones para concluir que 
P\ > Pi' 



www.FreeLibros.me 



424 



Estadistica 



EJERCICIOS 



Una media 

1. Una maquina llena an determinado producto en bolsas cuyo peso medio es p 
gramos. Suponga que la poblacion de los pesos es normal con desviacion 
estandar 20 gramos. 

a) Estime p de manera que el 99.38% de las bolsas tengan pesos no superiores 
a 550 gramos. 

b) Estime p mediante un intervalo de contlanza del 95%, si una muestra 
aleatoria de 16 bolsas ha dado una media de 495 gramos 

Rp. a) 500 b) 495 + 9.8. 

2. Se decide estimar la media p. del nivel de ansiedad de todos los estudiantes 
preuniversitarios. Se supone que la poblacion de los puntajes de la prueba para 
medir la ansiedad se distribuye normalmente con desviacion estandar igual a 10 
puntos. 

a) Determinar el intervalo para p. con confianza del 95%, si una muestra 
aleatoria de tamaho 100 ha dado una media de 70 puntos. 

b) Si jlx se estima en 70 puntos con el nivel de confianza del 98%, ^es el error 
de la estimacion puntual superior a 5 puntos? 

c) Si Ud. considera que el intervalo encontrado en a) no es muy preciso, <.que 
accion deberfa tomar para que el intervalo de estimacion al 95% sea mas 
preciso?. 

Rp. a) 70 + 1.96 b) No. es =2.33. c) aumentar el tamafio de la muestra. 

3 . El tiempo en minutos que utilizan los clientes en sus distintas operaciones en un 
banco local es una variable aleatoria cuya distribution se supone normal con 
una desviacion estandar de 3 minutos. Se han registrado los tiempos de las 
operaciones de 9 clientes del banco resultando una media igual a 9 minutos: 

a) Hallar el nivel de confianza si la eshmacion de p. es el intervalo de 7 a 11 
minutos. 

b) Si p se estima por jc, calcular la probabilidad de que la media de los tiempos 
de todas las muestras de tamaho 9 este entre 6.5 y 1 1.5 minutos. 

Rp a) 0 9544. b) 0.9876 

4 . Un fabricante afirma que el peso promedio de las latas de fruta en conserva que 
saca al mercado es 19 onzas. Para verificar esta afirmacion se escogen al azar 20 
latas de la fruta y se encuentra que el peso promedio es 18.5 onzas Suponga que 
la poblacidn de los pesos es normal con una desviacion estandar de 2 onzas. 

a) Utilizando un intervalo de confianza del 98% para p, <,se puede aceptar la 
afirmacion del fabricante? 
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b) iQui tamano de muestra se debe escoger para estimar p si se quiere un 
error no superior a 0.98 onzas con confianza del 95%?. 

Rp. a; 18.5 +0.932 .si. b)/i = 16. 



5. Sc quiere hacer una encuesta para estimar el tiempo promedio por semana que 
los ninos ven television. Por estudios anteriores se sabe que la desviacion 
estandar de dicho tiempo es de 3 horas. Con el nivel de confianza del 99%. 

a) 6 Que tamano de muestra se deberia elegir si el error de la estimacion puntual 
no es superior a media hora? 

b) <,Que costo se debe presupuestar para hacer la encuesta si esta tiene un costo 
fijo de $5000 mas un costo variable de $2 por cada entrevista,? 

Rp. a) n =238.7 = 239. b) $5478. 

6. Un fabricante produce focos cuya duracion tiene distribucion normal . Si una 
muestra aleatoria de 9 focos da las siguientes vidas utiles en horas 

775, 780, 800, 795, 790, 785, 795, 780, 810 

a) Estimar la duracion media de todos los focos del fabricante mediante un 
intervalo de confianza del 95%. 

b) Si la media poblacional se estima en 790 horas con una confianza del 98%, 
^cuanto es el error maximo de la estimacion si se quiere una confianza del 
98%? 

Rp. Utilizando el paquete MCEST se tiene. a) 790 + 8.59, b) 10 79. 

7. Para determinar el rendimienio anual de ciertos valores, un grupo de 
inversion! stas tomo una muestra aleatoria de 49 de tales valores encontrando 
una media de 8.71% y una desviacion estandar s - 2.1 % . 

a) Estime el verdadero rendimiento anual promedio de tales valores mediante 

un intervalo de confianza del 96%. 

b) Calcule el riesgo a si el rendimiento anual promedio de todos los valores se 

estima entre 7.96% y 9.46%. Rp. a) 8.71 T 0.615, b) 0.0124 

8. La duracion de cierto tipo de baterfa es una variable aleatoria cuya distribucion 
se supone normal. Inicialmente se estima que la duracion media es de 500 horas 
y que el 95% duran entre 480.4 y 519.6 horas. Si se eligen 9 baterfas al azar y 
se encuentra que la duracion media es 480 horas. Utilizando un intervalo de 
confianza del 95% para la media p, ^se deberfa inferir que la duracion media es 
diferente de 500 horas?. 

Rp. o= 10, 480 + 6.53. si 

9. Encontrar el tamano de muestra que se debe tomar para estimar la media de las 
longitudes de los tornillos que produce una fabrica con un error no mayor de 
0.0233 cm. al nivel de confianza del 98%, si; ademas se indica que la longitud 
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de los tornillos tiene distribution normal y si la longitud sc desvia de la media 
en a lo mas 0.08 cm. con probabilidad 0.9544. 

Rp o = 0.04 . ;i = 16 

10 . Las cajas de un cereal producidos por una fabrica deben tener un contenido 
promedio de 160 gramos. Un inspector de INDECOPI tomo una mucstra 
aleatoria de 10 cajas para calcular los pesos X f en gramos. Si de la mucstra 
resultan las siguientes sumas: 

10 10 

X , = 1 590 , X , 2 =252,858 

1=1 1=1 

Mediante un intervalo de confianza del 98% para (i, ^es razonable que el 
inspector multe al fabricante?. Suponga que e! peso de las cajas del cereal tiene 
distribution normal. 

Rp. x = 159, s = 2.309, ES=0.73. 159 + 2.06. No. 



11 . El ingreso mensual de cada una de las 500 microempresas de servicios dc una 
ciudad, es una variable aleatoria con media \l desconocida. Con el fin de 
simplificar la recaudacion de impuestos, la Sunat ha dispuesto que a estas 
empresas se las grave mensualmente con un 10% de sus ingresos De una 
muestra al azar de 50 microempresas se obtuvo un ingreso mensual promedio de 
$1000 con una desviacion estandar de $80. 

a) Estime el monto medio de los ingresos de las microempresas de la ciudad 
con un intervalo de confianza del 95% 

b) Estime el monto promedio de la recaudacion a estas microempresas con un 
intervalo de confianza del 95% 

c) Si el proposito de la Sunat es lograr mensualmente una recaudacion total de 
al menos $52,000 a estas microempresas, ^es factible que se cumplan sus 
metas?, ^por que?. 

Rp. a) 1C de ingresos p: 1000+21.06. b) R=0.\X, IC de p R :[97.894. 102.106], 
cjl IC del total: [48,947, 51 ,053], 52,000 no esta en el IC. No es posible 

12 . Un auditor escoge una muestra aleatoria de 15 cuentas por cobrar de un total de 
400 cuentas de una companfa y encuentra las siguientes cuentas en ddlare.> 

730, 759, 725, 740, 754, 745, 750, 753, 730, 780, 725, 790, 719, 775, 700 

Utilizando un intervalo de confianza del 95%, estime 

a) El monto promedio por cuentas por cobrar. 

b) El monto total de todas las cuentas por cobrar. 

Suponga que las 400 cuentas se distribuyen aproximadamente normal. 

Rp. x =745, s =24.6287. poblaci6n Ftnita, ES=6.247, gl=14, a) 745+13 4, b) 400(745 + 13.4) 
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13. Para la campana de Navidad una fabrica debe manufaeturar 2000 jugueies de 
cicrto tipo. Si una muestra aleatoria de 36 Uempos de fabrication en horas, 
jcj , t2»— JC 3e » de tales juguetes ha dado, 

I*; =108 , lx, 2 =325.4 

a) Estime el tiempo promedio por juguete mediante un intervalo de confianza 
del 97% 

b) Estime el tiempo total que se requiere para fabricar los 2000 juguetes 
mediante un intervalo de confianza del 97% 

Rp. x = 3, s- 0.2, ES =0.033. a) 3+0.072. b) 6000+143.22 

14 . Un comerctante estima en $55,000 el costo total de 3000 unidades de 
mercaderfa de di verso tipo que posee. Para verificar esta estimacion va a 
escoger una muestra aleatoria de n unidades para hacer una estimacion del costo 
total. Suponga que la poblacion de los costos es normal con a = $2.5 por 
artfculo. Calcular el valor de n si se requiere con confianza del 95% un error de 
la estimacion no superior a 0.6844. 

Rp. Poblacion finita, m=50.4=51 



Una proporcion 

15 . En un estudio socioeconomico se tome una muestra aleatoria de 100 
comerciantes informales y se enconlro entre otros datos los siguientes: un 
ingreso medio de $600, una desviacion estandar de $50 y solo el 30% tienen 
ingresos superiores a $800. 

a) Estimar la proporcion de todos los comerciantes con ingresos superiores a 
$800, mediante un intervalo de confianza del 98%. 

b) Si la proporcion de todos los comerciantes con ingresos superiores a $800 se 
estima entre 20.06% y 39.94% <.que grado de confianza se utilizo? 

Rp a) 0.3 + 0. 10677, b) I -cx=0.97 

16 . Una muestra aleatoria de 400 menores de 16 anos revela que 220 consumen 
licor. 

a) Estimar la proporcion de menores de 16 anos que consumen licor en toda la 
poblacion mediante una intervalo de confianza del 99% . 

b) 6 Que se puede afirmar con confianza del 99% acerca de la posible magnitud 

del error si se estima que el porcentaje de menores de 16 anos que consumen 
alcohol es 0.55? Rp. a) 0.55 + 0.064. b) 0 064 

17 . Un fabricante afirma que es 5% el porcentaje de piezas con algun tipo de 
defecto que resulta del total de la produccion. Para verificar tal afirmacion se 
toma una muestra aleatoria de 100 piezas y se encuentra que 10% ellos tienen 
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algun tipo de defecto. Mediante un intervalo de confianza del 95% para la 
proporci6n de piezas defectuosas de toda la production, ^es aceptable la 
afirmacidn del fabricante?. 

Rp. 0.1 T 0.0588, 0.5eI.C. se acepta la afirmacion del fabricante 

18. Dos candidatos A y B compiten como favoritos en las proximas elecciones. En 
la ultima encuesta a partir de una muestra grande de electores se estima.con una 
misma confianza que A tendna 40% de los votos con un error maxi mo de 3%, 
mientras que B tendna entre 3 1 % y 39% de los votos. 

a) En base a esta encuesta . ^cual de los dos candidatos seri'a el ganador 
absoluto?. 

b) iQue tamano de muestra se debe elegir si se quiere tener una confianza del 
98% de que el error de estimacidn de todos los electores a favor de A no sea 
superior al 2%?. 

Rp. a) Cualquiera, piles hay empate t^cnico. c) 3258 o 3394 (sin usar proporcidn) 

19. La oficina de planificaci6n familiar de cierta provincia quiere estimar el 
porcentaje de familias con m£s de 4 hijos, 

a) iQu6 tamano de muestra se requiere para asegurar con una confianza del 
95% que el error de la estimation de tal porcentaje no sea superior a 0.05? 

b) Si en una muestra aleatoria de 385 familias se encuentra que 154 de ellas 
uenen m6s de 4 hijos, estime el porcentaje de familias con mas de 4 hijos en 
toda la provincia, mediante un intervalo de confianza del 98%. 

Rp a) 385. b >0.4 + 0.058 

20. Se desea realizar un cstudio de mercado para determinar la proportion de 
amas de casa que prefieren una nueva pasta dental. 

a) Si la encuesta tiene un costo fijo de $500 mas un costo variable de $5 por 
cada entrevista, ^cudnto debena costar la encuesta si se desea que el error al 
estimar la proporcidn verdadera no sea mayor que 2%, con un mvel de 
confianza del 97%?. 

b) Si para el tamafio de muestra hallado en a) se encuentra que 736 prefieren 
la nueva pasta dental, estimar la proportion verdadera con un coeficiente de 
confianza de 99%? 

Rp. a) n=2944. costo total = 2944x55+500$= 15,220$, b) 0.25T0.01859 

21. Para estimar el porcentaje de todos los electores a favor de un candidato, una 

encuestadora debe determinar el tamano n de la muestra aleatoria para escoger 
de una poblaci6n de 10,000 electores, ^que tan grande debena ser la muestra si 
se quiere tener una confianza del 95% que el error de estimaci6n no sea superior 
al 4.8%?. Rp. 400. 198-401. 
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22. Un auditor toma una muestra aleatoria de 400 cuentas por cobrar y encuentra 
que 320 de ellas tienen deudas de al menos $700. Determine el nivel de 
confianza 

a) Si el porcentaje de todas las cuentas por cobrar de al menos $700 se estima 
de 75.76% a 84.24%. 

b) Si todas las cuentas por cobrar de al menos $700 de un total de 10,000 
cuentas por cobrar se estima en el intervalo [7543, 8457]. 

Rp. a) 0.966, b) 0.98. 

23. Un fabricante estima en 5% la proportion de piezas defectuosos de los 5,000 
producidos. 

a) Para confirmar tal estimacion primero se debe escoger una muestra aleatoria, 
^cuantas piezas debe tener la muestra si se quiere tener una confianza del 
95% que el error de la estimacion no sera superior a 0.047? 

b) Se escoge una muestra aleatoria del tamano calculado en a) , si en ella se 
encuentran 40 piezas defectuosos, mediante un intervalo de confianza del 
95%, ^se puede inferir que la estimacion del fabricante es coherente con la 
estimacion efectuada a partir de la muestra aleatoria?. 

Rp. a) /i^400 b) 0.1+0.0282, No, p= 5% no pertenece al I.C. 

24. Se quiere estimar p con un error maximo de estimacion e = 0.05, hallar el 
tamano de la muestra necesaria si la poblacion es de tamano /V=2000, 

Rp. p-0.5. n= 333.56=334 



Diferencia de dos medias y de dos proporciones 

25. Para comparar dos metodos de la ensenanza de las matematicas, se aplicaron a 
200 alumnos elegidos al azar el metodo traditional y a otra muestra de 250 
alumnos el metodo nuevo resultando las calificaciones promedios respectivos de 
13 y 15. Suponga que la varianzas poblacionales respectivas son 9 y 16. 

a) Determine un intervalo de confianza del 95% para la diferencia de las 
medias, 

b) ^Podemos afirmar que el metodo nuevo es superior al metodo antiguo? 

Rp -2 + 0.65, pi~p2=0c IC ademas, pi-p 2 <0, el metodo nuevo es mejor 

26. Se quiere estimar la diferencia entre los promedios de tiempos (en minutos) que 
utilizan los hombres y las mujeres para realizar un lest de aptitud. Se aplica el 
test a 20 hombres y 25 mujeres dando las medias respectivas de 110 y 100 
puntos. Suponga que las dos poblaciones son normales con varianzas 
respectivas iguales a 100 y 64. 

a) Determine un intervalo de confianza del 98% para la diferencia de las 
medias, 

b) ^Es valida la afirmacion Pi-fi2 = 13? 

Rp. 10+5.967, |i]-p2=0g IC ademas, pi-p 2 =13elC. 
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27. Se quiere estimar la diferencia entre los promedios de tiempos (en minutos) que 
utilizan dos operarios para realizar determinada tarea. Suponga quc las 
poblaciones de los dos tiempos se distribuyen normal mente con varian/a 
comun. Estime la diferencia entre los dos promedios poblacionales mediante un 
intervalo de confianza del 95% si el registro de 16 tiempos de cada operario han 
dado: 3c, =38, s, = 6 , y 3c 2 = 35, s 2 = 4 

Rp. ES= 1.8028, gl=30, 3 + 3.68, p,-p 3 e[-0.68. 6.68], 

28. Un inversionista hace un estudio para elegir una de dos ciudades del interior del 
pais para abrir un centro comercial. Escoge 21 hogares de la ciudad 1 
determinando: 3c, =$400, j, =$120 y escoge 16 hogares de la ciudad 2 
calculando: 3c 2 = $350, s 2 = $60. Suponga poblaciones normales con vananzas 
diferentes. Mediante un intervalo de confianza del 95%, ^.se puedc afirmar que 
son iguales los ingresos promedios de las dos ciudades? 

Rp ES=30.178, gl=31, 20 + 61.08, pi-p2=0eIC se acepta. pi-p?. 



29. Para comparar los gastos promedios mensuales de los alumnos de 2 
universidades particulars se escogen dos muestras aleatorias de 10 y 9 
alumnos respectivamente resultando los siguientes gastos en dolarcs: 

Mueslra 1: 400, 410, 420, 380, 390, 410, 400, 405, 405. 400. 

Muestra 2: 390, 395, 380, 390. 400, 380, 370, 390. 380. 

Mediante un intervalo de confianza del 95% para la diferencia de los promedios 
de los gastos mensuales, ^,se puede inferir que los gastos promedios son 
iguales?. Suponga que ambas poblaciones son normales, independientes, con 
varianzas desconocidas supuestas iguales . 

Rp. Utihzando el MCEST se tiene gl=!7, ES==4.726, 1.C: 15.89 + 9.97. No. 

30. Una agencia de publicidad realizo un estudio para comparar la efectividad de un 

anuncio en la radio en dos distritos Despues de difundir el aviso, se realizo una 
encuesta con 900 personas seleccionadas al azar, en cada uno de los distritos, 
resultando las proporciones 20% y 18% respectivamente. Si de los datos 
muestrales se infiere que p ] - p 2 e [-0.0162, 0.0562], ^que nivel de confianza 
se utilizd?. Rp l-a=0.95 

31. Dos muestras aleatorias de 250 mujeres y 200 hombres indican que 75 mujeres 
y 80 hombres consumirfan un nuevo producto unisex que acaba de salir al 
mercado. Utihzando un intervalo de confianza del 95%, ^se puede aceptar que 
es igual la proporcion de preferencias de mujeres y hombres en toda la 
poblacion?, si no es asi, ^cual es la relacion? 

Rp. -0. 1 T\ 96(0.0452). [-0.189, -0 01 1 ). pj^ademas es /; 
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Varianzas 

32. Se escoge una muestra aleatoria de 1 3 tiendas y se encuentra que las ventas de 
la semana de un determinado producto de consumo popular tiene una 
desviacion estandar s = $6. Se supone que las ventas del producto tienen una 
distribution normal. Estimar a) la varianza y b) la desviacion estandar 
poblacional mediante un intervalo de confianza del 95%. 

Rp. ( 432/23. 34 )<ct 2 < (432/4.4), entonces, 18.51 <ct 2 < 98. 18, y 4 30 <o<9.91 

33. Una de las maneras de medir el grado de satisfaction de los empleados de una 
misma categoria en cuanto a la politica salarial, es a traves de las desviaciones 
estandar de sus salarios. La fabrica A afirma ser mas homogenea en la politica 
salarial que la fabrica B. Para verificar esa afirmacion, se escoge una muestra 
aleatoria de 10 empleados no especializados de A, y 13 de B* obteniendo las 
dispersiones s A =50, s B =30 de salario minimo, ^cual seria su conclusion si 
utiliza un intervalo del 95% para el cociente de varianzas?. Suponga 
distribuciones normales. 

Rp 0.80< o ^ /Oj< 10.76,. Si. 
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PRUEBAS DE HIPOTESIS 



Introduction. 

El objetivo es dar algunos metodos que se usan para tomar decisiones sobre 
poblaciones, a partir de los resultados de una muestra aleatoria escogida de esa 
poblacion. Para lie gar a tomar decisiones estadisticas se debe partir de 
afirmaciones o conjeturas con respecto a la poblacion en el que estamos 
interesados Tales suposiciones, pueden ser verdaderas o no Una conjetura hecha 
sobre una poblacion o sobre sus parametros debera ser sometida a comprobacion 
experimental con el proposito de saber si los resultados de una muestra 
aleatoria extrafda de esa poblacion, contradicen o no tal conjetura. 



10.1 Hipotesis estadisticas. 

Definition. Se denomina hipotesis estadistica a cualquier afirmacion o conjetura 
que se hace acerca de la distribucion de una o mas poblaciones. 

La afirmacion o conjetura puede referirse bien a la forma o tipo de distribucion 
de probabilidad de la poblacidn o bien referirse al valor o valores de uno o m^s 
parametros de la distribuci6n conocida su forma. En las aplicaciones basicas, se 
asume dada la forma de la distribucion de la poblacion. En este caso, las hipotesis- 
estadisticas consisten en suponer que los parametros, que definen a la poblacion 
toman determinados valores numericos. 

Por ejempio, son hip6tesis estadisticas : 

1. La longitud media de un tipo de objetos es 10 centfmetros. 

2. La proporcion de objetos defectuosos producidos por cierto proceso nunca es 
superior al 8%. 

3. La varianza de la longitud de cierto tipo de objetos es 0.25 cm 2 

4. Son iguales las medias de dos tipos de mediciones independientes X e Y que se 

distribuyen normalmente con varianza comun a 2 . 
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Hipotesis simple y compuesta. 

Definicion. Se denomina hipotesis simple a cualquier hipotesis estadistica que 
especifica completamente la distribution de la poblacion, es decir. especifica la 
forma de la distribution y el valor de su(s) parametro(s). 

Si una hipotesis no espetifita eompletamente la distribution de la poblacion se 
dite que es una hipotesis compuesta 

Por ejemplo, la hipotesis que establece que el mgreso mensual promedio de 
los empleados de cierta ciudad es p = $500, suponiendo que los ingresos mensuales 
se distribuyen segun la normal con desviacion estandar conocida a = $30 . es una 
hipotesis simple, pues, especifica completamente la distribucion de la poblacion.. En 
cambio, si se supone que los ingresos mensuales se distribuyen segun la normal 
con desviacion estandar conocida a = $30 y se afirma que el ingreso promedio 
mensual es p * 500 6 p < 500 6 p > 500 , entonces, la hipotesis referente a la 
media es una hipotesis compuesta, pues, no especifica la media de la distribucion 
de la poblacion de los ingresos. 

Hipotesis nula y alternativa 

Definicion. Se denomina hipotesis nuia y se representa por H 0 , a la hipotesis que 
es aceptada provisionalmcnte como verdadera y cuya validez sera sometida a 
comproDacion experimental Los resultados experimentales nos permitiran seguir 
aceptandola como verdadera o si, por el contrario, debemos rechazarla como tal. 

Toda hipotesis nula va acompanada de otra hipotesis alternativa. 

Definicion. Se denomina hipotesis alternativa y se representa por o por 
H A , a la hipotesis que se acepta en caso de que la hipotesis nula H 0 sea 
rechazada. La hipotesis alternativa H j , es pues una suposicion contraria a la 
hipotesis nula. 

Por ejemplo, si se asume que 0 O es un valor del parametro desconocido 0 de 
una poblacion cuya distribucion se supone conocida, entonces son hipotesis nulas 
y alternativas respectivamente las siguientes afirmaciones: 

1) // O :0 = 0 O , y //,:0*0 O 

2) // o :0<e o . y H,:Q>Q 0 

3) W 0 :6>e 0 , y W,:6<e 0 
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Prueba de una hipotesis estadistica 

Para tomar decisiones estadisticas, se requicren de las dos hipotesis: la 
hipotesis nula y la hipotesis cilternativci referidas a un parametro 0. 

La prueba de una hipotesis estadistica es un proceso que nos conduce a tomar 
la decision de aceptar o rechazar la hipotesis nula H 0 , en contraposicion de la 
hipotesis alternativa H { y en base a los resultados de una muestra aleatoria 
seleccionada de la poblacion en esludio. 

La hipotesis nula H 0 es la primera hipotesis que se plantea. y debe ser 
establecida de manera que especifique un valor 0 O del parametro 0 en estudio. Por 
esta razon, algunos autorcs plantean la hipotesis nula A/ 0 :0 = 0 O aun para los 
casos2) y 3) del ejemplo anterior . 

La aceptacidn de una hipotesis significa que los datos de la muestra no 
proporcionan evidencia suficiente para refutarla. El rechazo significa que los datos 
de la muestra lo refutan. 

Tipos de pruebas de hipotesis. 

El tipo de prueba depende basicamente de la hipotesis alternativa H\. 

Se denomina prueba de una cola a toda prueba de hipotesis donde la alternativa 
H i es unilateral. Si la alternativa cs bilateral, la prueba se denomina prueba de dos 

colas. 

La prueba de hipotesis H 0 :0 = 0 O contra H x 0 * 0 O se denomina prueba 
bilateral o de dos colas. 

La prueba dc hipotesis // O :0 = 0 O contra H i :0>0 O se denomina prueba 
unilateral de cola a la derecha 

La prueba de hipotesis H 0 :0 = 0 O contra //, :0<0 O se denomina prueba 
unilateral de cola a la izquierda 



Errores tipo I y tipo II, y Nivel de significacion 

Al tomar la decision de aceptar o rechazar la hipotesis nula H 0 : 0 = 0 O en 
base a los resultados obtenidos de una muestra aleatoria seleccionada de la 
poblacion en estudio; hay cualro posibles situaciones que determinan si la decision 
tomada es correcta o incorrecla. como se muestra en la tabla 10-1 
Definicion. Se denomina error tipo I, al error que se comete al rechazar una 
hipotesis nula // 0 cuando esta realmente es verdadera 

Definicion. Se denomina error lipo II, al error que se comete al aceptar una 
hipotesis nula H 0 cuando en realidad es falsa. 
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La probabilidad de cometer un error tipo I se denota por a. Entonces, 

a = P[error tipo I] = P[rechazar H 0 cuando H 0 es verdadera] 
La probabilidad de cometer un error tipo II se denota por p. Entonces, 

P = Pferror tipo II] = H^ceptar H 0 cuando H 0 es falsa]. 



Tabla 10-1 



Decision 


H 0 verdadera 


H 0 falsa 


Rechazar H 0 


Error tipo I 
Probab: a 


Decision correcta 
Probab: 1-P 


Aceptar H 0 


Decision correcta 
Probab: 1-a 


Error tipo II 
Probab: P 



Definition. Se denomina nivel de signification de una prueba de hipdtesis a la 
probabilidad de .cometer un error de tipo L 

Definicion. La potencia de una prueba es la probabilidad de tornar la decision 
acertada de, rechazar H 0 cuando esta es falsa o de aceptar H j cuando esta es 
verdadera La potencia de una prueba es calculada por 1 - p . 

El nivel de significacion se fija previamente por lo general en a = 0JQ5 o 
a = 0.01 . Si para un valor dado de a, se rechaza la hipotesis H 0 , entonces se dice 
que los resultados muestrales obtenidos, no solo son diferentes por efectos del azar, 
si no que son realmente significativamente diferentes al nivel a x 100% , es decir; 
se espera que de 100 resultados muestrales en a x 100% de las veces se rechazara 
la hipotesis nula H 0 cuando realmente es verdadera. 

Para una muestra aleatoria de tamano n seleccionada de la poblacion en estudio, 
si a aumenta, entonces p disminuye, y si p aumenta, entonces a disminuye. Por 
supuesto, en todo proceso de toma de decisiones sobre hipotesis estadfsticas, es 
deseable disminuir las probabilidades de cometer esos dos tipos de errores. Este 
problema es tratado ampliamente en otros textos de estadistica. 



Region critica y regia de decision 

Despues de plantear la hipotesis nula H 0 y su correspondiente alternativa //, 
referentes a un parametro 0 , y especificado el tamano a del nivel de significacion 
de la prueba de H 0 contra H , , se debera determinar una estadfstica © 
correspondiente al parametro, cuya distnbucion muestral se conozca. Por ejemplo, 
si las hipotesis H 0 y H , se expresan en terminos de la media poblacional p. 
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entonces se seleccionar& la media muestral X como la estadistica apropiada para 
efectuar la prueba. 

Si se supone que la hipotesis nula // 0 :8 = © 0 es verdadera; entonces, la 
distribueion de probabilidad de la estadistica © queda bien definida por esta 
hipotesis, ya que esta hipotesis especifica completamente la distribueion. 

En la distribueion de probabilidad fijada por la hipotesis H 0 : G = 0 O se 
establece la regia de decision de acuerdo con la cual se rechazara o por el contrario 
se aceptar£ la hipotesis H 0 . El rechazo de la hipotesis nula H 0 implica la 
aceptacion de //, . 

La regia de decision implica la division de la distribueion muestral del 
estadfstico © de la prueba en dos partes mutuamente excluyentes: la region 
de rechazo o region critica (R.C.) de H 0 , y la region de aceptacion (R.A.) o no 
rechazo de H 0 . Esta division depende de la hipotesis alternativa H } , del nivel de 
signifkaeion - y do la distribution muestral del ostadislico. 

Por ejemplo, supongamos que se tiene una poblacion normal /V(p, 9) con 
varianza ronocida ct =9 y que se trata de probar o docimar la hipotesis nula 
// 0 :p = 70 contra H l :\x>10. 

Dado que X es un buen estnnador de p utili/aremos esta estadfstica para 
determinar la region critica 'y la regia de decision de esta prueba. Puesto que 
estamos interesados en la discrimination entre p = 70 y valores de p > 70 

parece razonable que debamos rechazar H 0 si X - 70 es muy grande, esto es 

si X > K , siendo K un valor critico que vamos a determinar. 

Si se supone verdadera la hipotesis H 0 : p = 70 , entonces, la distribueion de la 

media X es normal con media p = 70 y desviacion estdndar a - 3 . 

En consecuencia la distribueion de 



es normal 7V(0,1 ). 

Para una muestra aleatoria de tamano n- 40 y la probabilidad de error tipo 1, 
a = 0.5 se tiene (ver figura 10.1). 

0.05 = P [ rechazar // 0 cuando H 0 es veradera]= P[ X > Kf\i = 70] 



X -70 
3/ 4n 
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De la tabla normal N( 0, 1 ) se obtiene: 

K —70 

- — — = 1 .645 , luego K -70 + 1.645x0.474 = 70.78. 

0.474 

Por tanto, la region crftica en el rango de variacion de X es el intervalo 

R.C. =]70.78, +oo[ 

La regia de decision es: si x es el valor de X obienido a partir de una muesira 
aleatoria de tamano 40, se rechazara H 0 si x > 70.78 . 




Figura 10.1: Regi6n crftica cola a la derecha en la variable X 



Procedimiento de la prueba de hipotesis 

Previamente debe formularse el problema estadistico, determinar la variable en 
estudio y el metodo estadistico adecuado para la solucion del problema. El 
procedimiento general de la prueba de una hipotesis de parametro 0 se resume en 
los siguientes pasos: 

1) Formular la hipotesis nula // O :0 = 0 O y la hipotesis alternativa adecuada 

f/, :0*0 O 6 //,:0>0 O 6 //, :0<0 O 

2) Espccificar el tamano a del nivel de signification. 

3) Seleccionar la estadistico apropiada a usar en la prueba. 

4) Establecer la regia de decision , determinando la region crftica de la prueba. 

5) Calculare] valor del estadistico de la prueba a partir de los datos de la muestra. 

6) Tomar la decision de rechazar la hipotesis H 0 si el valor del estadistico de la 
prueba esta en la region crftica. En caso contrario, no rechazar H 0 . 



www.FreeLibros.me 



438 



Estadistica 



10.2 Pruebas de hipotesis acerca de la media p: 
Varianza a 2 supuesta conocida 

Sea X la media de una muestra aleatoria de tamano n seleccionada de una 
poblacion con media p y varianza cr~ supuestamente conocida. 

Si la poblacion es normal /V(p, cr 2 ), entonces, la distribucion de la 
estadistica X es exactamente normal /V(p, o 2 /n) para cualquier valor de n 
(n > 2) . Si la poblacion no es normal , pero el tamano de la muestra es 

suficientemente grande ( n > 30 ), entonces, la distribucion de X es 
aproximadamente normal /V(p, o 2 /n). Entonces, 



La estadistica para la prueba acerca de p con varianza cr conocida es 



Z = 



X-\i 




cuya distribucidn es exacta o aproximadamente normal estandar N( 0,1), segun sea 
la poblaci6n normal o no 



Si se supone verdadera la hipotesis nula: f/ 0 :p = p 0 , la estadistica 

especificada por esta hipdtesis es entonces: 



X-Vo 

c/yfn 



1) Prueba bilateral o de dos colas 

Si se prueba H 0 :p-p 0 contra H x :p5*p 0 , dado el nivel de significacion 
a, en la distribuci6n de Z = (X -p 0 )/(a/ yfn) , que es normal yV(0,l) f se 
determina el valor £]_ a / 2 tal que la probabilidad de rechazar H 0 cuando se supone 
verdadera sea (figura 10.2) 

P[Z < -Zi-a /2 J = a/2 o P[Z>z,_ a/2 ] = a/2. 

En consecuencia, la region critica en el rango de variacion de Z es: 

R.C. = {Z< -z,_ a/2 o Z > z,_ a/2 } . 



Por otro lado, la probabilidad de aceptar H 0 cuando sc supone verdadera es: 
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F*l Z\-a/2 -Z < Z\- a ]2 1 - 1 <*• 

Resultando la region de aceptacion: R.A. = {-Zi_ a / 2 ^Z < Zi_ a / 2 } * 




Rechazar H 0 \ Aceptar H 0 | Rechazar H 0 



Figura 10.2: Region cntica bilateral en escalas zy x 

Regia de decision es: Si z k = (3c-p 0 )/(o7 yfn) es un valor de Z obtenido de la 
muestra, entonces, se rechazard H 0 con riesgo igual a a, si 3c e R.C. (o si 
Z 2 R.A. I 

No se rechazara H 0 en caso conlrario (figura 10.2). 

Si se rechaza H 0 se dice que el valor es significativo con un riesgo cuyo 
valor es a . 

NOTA. (Region cntica en X ) 

Si se sustituye Z = (X -p 0 )/(a7 Jn) en RC resulta la region cntica en el 
rango de variacion de X : 

R.C. = {X < a o X>b}. 

donde a = |i 0 ~ Z } - a/2 (a/-Jn) . y 6 = Ho + ^i-a/ 2 ) 

La region de aceptacion es el intervalo en X : 

R.A. = [a <X <,b]. 

La regia de decision es: Si x es el valor de X obtenido a partir de una muestra 
aleatoria, se rechazara H 0 con un riesgo a , si 3c e R.C. (o si 3c g R.A . ). 

No se rechazara H 0 en caso contrario (figura 10.2). 
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2) Prueba unilateral de cola a la derecha 

Si se prueba H 0 : p = p 0 contra //, : p > |i 0 , dado el nivel de significacion 
a, en la distribution de Z = (X / -Jn) que es normal A'(0,1 ), se 
determina el valor z,_ a tal que (figura 10.3), 

P[Z > z,_ a / H : |i = |i 0 verdadera] = a 




Ho 

Accptar H 0 | Rechazar H 0 

Figura 10.3: Regidn critica cola a la derecha en escalas z y x 
En consecuencia, la region critica en el rango de variacion de Z es: 

R.C. = [Z>z l _ a ] 

La region de aceptacion es: R.A . = {Z < z,_ a ) . 

La regia de decision es: Si z k =(x-\ jl q )/(o / yfn) es un valor de Z obtenido a 
partir de una muestra, se rechazara H 0 si z k e R.C. (o si z k ^ R.A . ). 

No se rechazara H 0 cn caso contrano (figura 10.3). 

NOTA. (Region critica en X ) 

Si se sustituye Z-{X -p 0 )/(cr/V«) en RC resulta la region critica en el 
rango de variacion de X : 

R.C. = {X >b x ] 

donde, b x = ji 0 + z,_ a (a/ -Jn) 

La region de aceptacion es el intervalo: 

R.A. = [X<b x ) 
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La regia de decision es: Siendo x el valor de X obtenido a partir de una muestra 
aleatoria de tamano rc, se rechazard H 0 con un riesgo a, si xeR.C. (o si 

xzR.A.). No se rechazara f/ 0 en caso contrario. (figura 10.3). 

3) Prueba unilateral de cola a la izquierda 

Si se prueba H 0 : p = p 0 contra H x : p < p 0 , dado el nivel de sigmficacion a , 

en la distribucion de Z = (X -^ 0 )/(a/ V«), se puede determmar el valor z,_ a tal 
que (figura 10.4) 

P[Z < - z,_ a / H : ji = p 0 verdadera] = a 
En consecuencia, la region cntica en el rango de variacion de Z es: 

R.C. = {Z <“Zj_ a } 

Region de aceptacion es: R.A. — {Z> —Zj_ a } . 

Regia de decision :Si z k = (x - p 0 )/(ar/ yfn ) es un valor de Z obtenido a partir de 
una muestra, se rechazara H 0 con un riesgo a, si x € /?.C. (o si jcg /?.A. ). 

No se rechazara H 0 en caso contrario ( figura 10.4). 




Rechazar H 0 | Aceptar H 0 

Figura 10.4: Regidn cntica cola a la izquierda en escalas z y X 

NOT A. (Region cntica en X ) 

Si se sustituye Z = (X -p 0 )/(o / yfn) en RC se obtiene la regidn cntica en 
el rango de variacion de X : 

RC = {X <a { ] 

donde, a x = |i 0 - z,_ a (a/ yfn) 
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Region de aceptacion : RA = {X > a x } . 

Regia de decision es: Si jc es un valor de X obtenido a partir de una muestra 
aleatoria de tamano rc, se rechazara H 0 con un riesgo a si jc e R.C. (o si 
xeR.A . ). 

No se rechazara H Q en caso contrario (figura 10.4). 

EJEMPLO 10.1. 

Un determinado proceso de empaquetar un producto esta controlado. si el peso 
medio del producto empaquetado es 400 gramos. Si en una muestra aleatoria de 
100 paquetes del producto se ha encontrado que el peso medio es de 395 gramos, 
^Se podria concluir que el proceso esta fuera de control al nivel de significacion 
59c?. Suponga que el peso de los productos empaquetados se distribuye 
normalmente con desviacion estandar de 20 gramos. 

SOLUCION. 

Sea X la variable aleatoria definida como el peso de los paquetes del producto. 
Se supone que la distribucion de X es /V(p, (20) 2 ). 

1. Hipotesis: H 0 :p = 400 (el proceso esta controlado). 

H ] : p * 400 (el proceso esta fuera de control). 

2. Nivel de significacion : a = 0.05. 

3. Estadistica : Poblacidn normal con varianza conocida, la estadistica es 




cuya distribucion es normal /V(0, 1 ). 

4. Region critical Si se supone verdadera la hipotesis nula H 0 , para a = 0.5 y la 

alternativa bilateral, en la distribucion de Z = (X -400)/ (20/^100) , se 
encuentra el valor critico: 



z l-a/2 - Zo.975 “ * *96 

Luego, la region cntica en la variable Z esta dada por 
RC = {Z< -1.96 o Z > 1 .96) 

5. Cdlculos : De los datos se tiene: 
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n = 100, x - 395, o = 20, 

395-400 

2, "^r — 2 2 - 5 - 

6 . Decision: Puesto que z k = “2.5 g /?.C, debemos rechazar H 0 y concluir con 
un riesgo de 5%, que el proceso de empaquetar no esta controlado. 

NOT A. En el rango de variaci6n de X , la region critica es: 

R.C. = {X <400-1.96x2 o X > 400 + 1 .96x2} 

R.C. = { X < 396.08 o X > 403.92} 

El hecho que 3c = 395 g R.C., se debe rechazar H 0 y concluir con un riesgo de 
5%, que el proceso de empaquetar no esta controlado. 

NOT A. (Regia de decision en Intervalo de conflanza) 

La prueba bilateral de la hip6tesis nula H 0 :p = p 0 contra H x :p * p 0 a un 
nivel de signification dado a, equivale a calcular el intervalo de conflanza (/.C.) 
de (l-a)xl00% para el parametro p y luego rechazar la hipdtesis nula 

H 0 :p = p 0 s * es 9 ue Pu £ 

En efecto, si x es un valor de X , no se rechazara H 0 : p = p 0 si el valor 
. z* ert.A =[-21-0/2. Zi-^/2 ] » donde z k =(x-]i 0 )/(al 4 n) 

*~Mo 

°» SI " z \-aj2 - “ - ^l-a/2 

Tn 

Esto es, no se rechazara // 0 : p = p 0 si 



* G /?.A. -[p 0 - Zj-ot/2 “#=■* Po + ^l-a/2 

o equivalentemente si p 0 se encuentra dentro del intervalo de conflanza (/.C.) del 
(l-a)xl00% parap: 



Mo eI.C. = lx-Zi _ a/2 

v« 



x + *l-a/2 
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Por tanto, se rechazar£ H 0 con riesgo a si. 

x g R.A. o si p 0 € l.C 
Por ejemplo, en el ejemplo 10. 1 , para a = 0.05 se tiene: 



l.c.= x- Zl . aj2 ~,x + z^ a/2 -^= =[391.08.398.92] 




R.A. = 



Po ^l-a/2 r— 'Po^^l 



G 



- a /2 -j= = [396.08. 403.92], 



rn 



Dado que p 0 = 400g/.C. (o que jc = 395 ^ R.A.) se debe rechazar H 0 con un 
riesgo del 5%. 

NOTA. (Metodo del valor P en la prueba) 

Otra forma de establecer la regia de decision, en estadfstica aplicada, es 



se obtiene de la muestra), de manera que 

a) P = P[Z < -z k ] + P[Z > z k J = 2 P[Z > z k ] (para dos colas). 

b) P = P[Z > z k ] (cola a la derecha). 

c) P = P\Z < -z k 1 (cola a la izquierda). 

Si el valor de P < a , entonces. se rechazara H 0 . No se rechazara H 0 , cn caso 
contrario. 

Las pruebas de hipotesis con el paquete estadfstico MCEST coniienen el metodo 
del valor P. 

En el ejemplo 10.1, el valor absoluto de z k es igual a 2.5, entonces. 



Dado que P = 0.0124 < a = 0.05 , se debe reehazar // 0 , con un riesgo 
a = 0.05 . Observar que z k es significativo en un valor mucho menor que 
a = 0.05 y que este valor de z k solo ocurrira en 124 casos de 10.000 
experimentos. 

Una region cntica de tamano 0.0124 es muy pequcna y, por lo tanto, es 
poco probable que se cometa error tipo I. 



calculando el valor P, a partir del valor absoluto 




P = 2 P[Z >z k ] = 2 P[Z > 2.5] = 2(0.0062) = 0.0124 
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EJEMPLO 10.2. 

A1 estudiar si conviene tener o no una sucursal en la ciudad de Tarapoto, la 
gerencia de una gran tienda comercial de Lima, establece el siguiente criterio para 
tomar una decision: Abrir la sucursal solo si el ingreso promedio familiar 

mensual en dicha ciudad es no menos de $500 y no abrirla en caso contrario. Si 
una muestra aleatoria de 100 ingresos familiares de esa ciudad ha dado una media 
de $480. 

a) ^Cual es la decision a lomar al nivel de significacion del 5%?. 

b) ^Con que probabilidad la prueba anterior detecta la diferencia igual a $30 en el 
promedio de ingresos y por debajo de lo que se indica en la hipotesis nula?. 

c) Calcular la potencia de la prueba si el ingreso promedio realmente es $464. 

Suponga que la distribucion de los ingresos tiene una desviacion estandar igual 
a $80. 

SOLUCION. 

Sea X la variable aleatoria que representa los ingresos familiares mensuales de 
los pobladores de Tarapoto. 

a) 1 . Hipotesis : H 0 : p = 500 (6 H 0 : p > 500 ) (se abre la sucursal). 

H j : p < 500 (no se abre la sucursal). 

2. Nivel de significacion : a = 0.05. 

3. Estadfstica : Poblacion no normal, n~ 100, a = 80, por teorema central del 

limite la estadfstica apropiada es: 




cuya distribucion es aproximadamente normal A(0,1). 

4. Region crftica: Si se supone verdadera la hipotesis nula H 0 para a = 0.5 y 

la alternativa unilateral cola a la lzquierda, en la distribucion de 
Z = (X-500)/(80/Vi00) , se encuentra el valor crftico 
Z a =Z0.05 = -1 645 

Luego, la region crftica en la variable Z es: RC = [Z <-1.645} 

5. Calculos: De la muestra se tiene, x = 480 

Jr -500 480-500 

z k = — j = = -2.5, 

80/Vl00 8 

6. Decision: Dado que z k = -2.5 e R C, debemos rechazar H 0 y concluir con 

no abrir la sucursal en la ciudad de Tarapoto. 
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b) La regi6n crftica de H 0 es: 

RC = {Z< -1.645}= {X <500-1.645x8} = {X <486.84} 



La prueba anterior detecta la diferencia igual a $30 en el promedio de ingresos 
por debajo de lo que se indica en la hipotesis nula si se rechaza H 0 cuando 
p = 470 . Entonces, 



P[X < 486.84/ p = 470] = 



Z< 



486.84 - 470 

80/V100 



= P[Z < 2. 1 1] = 0.9826 



c) La potencia de la prueba es: 1 - p = 1 - 0.002 1 = 0.9979 , donde la probabilidad 
P de aceptar H 0 cuando realmente es p = 464 (error tipo II) es: 

486.84 - 464 



P = P[X >486.84/ p = 464] = P 

P = p[z> 2.86] = 0.0021. 



Z2- 



80/a/100 



= P[Z > 2.86] 



EJEMPLO 10.3. (Tamano de la muestra) 

Suponga que X es una poblacion normal con media p (desconocida) y con 
varianza a 2 conocida. Dadas las probabilidades a y P de cometer errores tipo I y 
tipo II respectivamente, determinar el tamano n de la muestra requerida para probar 
las hipotesis simples 

H 0 ;p = p 0 contra H ] :p = P| donde p, <p 0 . 



SOLUCION. 

Sea K el punto critico en la variable X , de la prueba unilateral cola a la izquierda 
de H 0 contra H x (figura 10.5), entonces. 




Rechazar H 0 Aceptar H 0 

Figura 10.5: Tamano de muestra en prueba de hipotesis 
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a = P[error tipo II = Pfrechazar H 0 / H 0 : p = p 0 es verdadera] 
a = P[X<K/» = \ 1 0 ]=P 



X Pp < K -p 0 



= P 






I 



a/ yfn a/ yfn 

de donde resulta (por ser a menos del 50% del area total y z a = -Zj_ a ) 

K-Po 



K M^O ^l-a / — 
yin 



dr 

De igual manera, 

(3 = P[error tipo II] = P [ aceptar H 0 / H 0 :p = p 0 es falsa] 
P = P[aceptar H 0 / // 1 : p = p t es verdadera] 

P = P[X>/C/p = p,] = P 
de donde resulta. 



. K-Vt 


— p 




1 

a 

i> 


— i 


!> 



*~Pi 

a/yfn 



1 Z|-p> 



v a 

^ - Pi + Z|_p —r= 

<n 



Resolviendo para n las ecuaciones (1 ) y (2). resulta 

(^l-a ^1-p ) ^ 



rt = - 



(Po "Pi) 2 



NOTA. 

Si la prueba unilateral es de cola a la derecha, esto es si se prueba. 

// 0 :p = p 0 contra //,:p = p,, donde p 0 <Pi 
el tamano n de la muestra requerida es tambien: 



n = 



( 



l^I-a + ^1-p 






(Ko-K,) 2 ' 

Si la prueba es bilateral, esto es, si se prueba: // 0 :p=p 0 

H x : p = ft | , p 0 * p, , el tamano n de la muestra requerida es 



(1) 



( 2 ) 



contra 
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n 



fa-g/2 + Zl-p) 2 ^ 2 

( Mo -^) 2 



EJEMPLO 10.4. 

El gerente de ventas de una compania afirma que sus vcndedores venden en 
promedio diariamente $1500. Disene una prueba para esta hipotesis si se quiere que 
el riesgo sea 1.5% de rechazar la afirmacion cuando realmente es verdadera y el 
riesgo sea de 0.75% de aceptar la afirmacion cuando realmente es $1523 el 
promedio de las ventas diarias. Suponga que la distribucion de las ventas es normal 
con una desviacion est&ndar de $50 

SOLUCION. 



Sean las hipotesis: H 0 : p = 1500 y H ] : p = 1523. 

Si se supone verdadera la hipotesis nula // 0 :p = 1500, entonces 



distribucion de 



^ X -1500 1AI/ „ 1X 

Z = . f— es normal /V(0, 1). 

50/ 



Luego f para a = 0.015 = f*[Error tipo I], en esta distribucion se tiene. 



0.015 = P [ rechazar H 0 / H 0 :p = 
0.015 = p[x > K/\l = 1500]= P 



1500 es verdadera] 
^ K -1500 

> 50 



la 



, . . , tf-1500 „ _ ^ 2.17x50 

de donde resulta: - =+2.17. K = 1 500 + -= — 

50 /*Jn yjn 

Tambien, si se supone verdadera la hipotesis alternativa // j : = 1 523 . 

X — 1500 

entonces, la distribucion de Z= es normal N( 0, 1 ). 

50 /4n 

Luego, para (J = 0.0075 = P[ Error tipo II], en esta distribucion se tiene: 

0.0075 = P[aceptar H 0 / H ] : p = 1523 ] 



0.0075 = p[x < K / |i = 1523] = 



z< 



K -1523 

50/Vn 



- 1523 
50 / yfn 



-2.43, 



K =1523- 



2.43x50 
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* ^ ^ 2.17x50 . „ 2.43x50 

Luego de: K - 1500 + -= — y de AT = 1523 — , se obtiene: 

yjn yin 

■Jn = 10 , n = 100 

Con el valor de n- 100 , se obtiene el critico de la prueba: K = 15 10.85 
Si x es un valor de media de la muestra de n = 100 casos, se rechazara la hipotesis 
nula H 0 si jc > 1510.85 . En caso contrario, no se debe rechazar H 0 . 



10.3 Pruebas de hipotesis acerca de la media p: 
Varianza a 2 supuesta desconocida 



A) Poblacion no normal 

Si la poblacion no tiene distribucion normal y si la varianza es desconocida. para 
probar hipotesis acerca de la media p, solo si, el tamano de la muestra es grande 
( n > 30 ), se suele utilizar la estadistica: 

7 _ X~»o 
~ O !47r 

cu>a distribucion es aproximadamente M0. 1). La desviacion estandar a se estima 
puntualmente por s 

Luego, las regiones criticas de la pruebas de H 0 : p = p 0 contra cualquiera de las 
tres alternativas f/,:p>p 0 6 77,:p<p 0 6 //,:p*p 0 son las mismas 

(aproximadamente) de la seccion 10.2. 

B) Poblacion normal 

Si la poblacion tiene distribucion normal N(u,cs 2 ) , donde p y a 2 son 

parametros desconocidas, para n > 2 la estadistica de la prueba acerca de la media 
p es: 




cuya distribucion es /-Student con n - 1 grados de libertad. 
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Si se supone verdadera la hipotesis nula: H 0 :p = p 0 , la estadistica especificada 
por esta hipotesis es entonces, ahora: 

r 

s/- Jn 

NOTA. La estructura de la prueba es identica que en el caso de a conocida, salvo 
que el valor de a se estima por s y la distribucion normal estandar se sustituve 
por la distribucion t de Student con n - 1 grados de libertad. 

1) Prueba bilateral o de dos colas 

Si se prueba H 0 :p = p 0 contra H j :p *|i 0 , dado cl nivel de significacidn a. 
en la distribucion de T = (X-f i 0 )/{s / J~n) ~t(n- 1), se determinan los valorcs 
ifj_ a / 2 , n-i > ta ^ es Q ue probabijidad de rechazar // 0 cuando se supone verdadera 
sea (figura 10.6) 

PIT < -'i-a/2. n-i 1 = a/2 o P[T > f,_ a/2 . = a/2 . 

Luego, la region crtiica en el rango de variacion de T t s 

R.C. = [T < -*]_ a /2, «-l ° T > *i-a/2./j-l ) 

La region de aceptacion es el intervalo 

R A- = Wl_a/2.n-f - ^ “ r l-a/2 fj-1 1 

Regia de decision: Se rechazara H 0 con riesgo a, si t k e R.C. (o, si t k & R.A ). 
No se rechazara H 0 en caso contrario. 




Rechazar | Aceptar H 0 j Rechazar H 0 
Figura 10.6: Regidn crftiea bilateral en esc alas i y x 



NOTA. Si se sustituye T = (A r -p 0 )/(.?/ yfn) en R.C se obuene: 
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la region critica en el rango de variacion de X : 

R.C. = {X < a o X > b] 

donde a = \i 0 -t i . a/2 .„-i(s/yf7i) , y b = \i 0 +t } _ a/2 n _ l {s/^) 

Regia de decision : Siendo x cl valor de X obtenido a partir de una muestra 
aleatoria de tamano n , se rechazard H 0 con un riesgo a . si re R.C . (o si 

x e R.A. = (R.C.) c ). No se rechazard // 0 en caso contrano (figura 10.6). 

2) Prueba unilateral de cola a la derecha 

Si se prueba H 0 : p = p 0 contra H { : p > p 0 , dado el nivel de significacion a, 
en la distribution de T = (X - p 0 )/(s / Jn) ~ t(n- 1), se determina el valor 
tal que: (figura 10.7) 

P\T > h-a.n-i / H 0 : p = p 0 verdadera] = a 
Luego, la region critica en el rango de variacion de T es: 

RC = {T 

La region de aceptacion es el intervalo: 

RA = {T<t l _ a ^} 




Ho b \ 

Aceptar H 0 | Rechazar H 0 



Figura 10.7: Regi6n cntica cola a la derecha en escalas tyx 

Regia de decision Se rechazard H 0 si t k e R.C. (o si t k e R.A.). No se 
rec hazard H 0 en caso contrario. 
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NOTA. La region critica en X (figura 10.7) es: RC = {X>b l ], donde 
b i =X <^ 0 (s/^) 

3) Prueba unilateral de cola a la izquierda 

Si se prueba H 0 p = p 0 contra H x :p<|i 0 , dado el nivel de significacion 
a, en la distribution de T = (X -p 0 )/(f/V«) ~ t(n- 1) se determina el valor 

r i-a.n-l » tal ^ Ue > ( fi g ura 10* -8) 

PIT < / H 0 : p = p 0 verdadera] = a 

Luego, la region critica en el rango de variacion de T es: 

RC = {7' < -/j_ a ] 

La region de aceptacion es el intervalo: 




Rechazar H 0 | Aceptar H 0 

Figura 10.8: Region cntica cola a la izquierda en escalas i y JC 

Regia de decision : Se rechazara H 0 si t k e R.C. (o si t k g R.A . ). No sc 
rechazard H 0 en caso contrario (Figura 10.8). 

NOTA. La region critica en X (figura 10.8) es RC = {X<a x ), donde 
a, = X<^ 0 (f/Vn) 
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EJEMPLO 10.5. 

Las cajas de cierto tipo de cereal procesadas por una fabrica deben tener un 
contenido promedio de 160 gramos. Por una queja ante el defensor del consumidor 
de que tales cajas de cereal tienen menos contenido, un inspector tomo una muestra 
aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos: 

157, 157, 163, 158, 161. 159, 162, 159, 158, 156 

^Es razonable que el inspector multe al fabricante?. Utilice un nivel de significacion 
del 5% y suponga que los contenidos tienen distribucion normal. 

SOLUCION. 

Sea X la variable aleatoria que representa los pesos de las cajas del cereal. Se 
supone que la distribucion X es normal con media p y varianza a 2 desconocidas. 

1 ) Hipotesis: H 0 : p = 160 (No multa al fabricante) 

//, : p < 160 (Multa al fabricante) 

2. Nivel de significacion a = 0.05 

3. Esiadfstica : Poblacion normal, con varianza desconocida y « = 10 

Si H 0 : p = 160 es verdadera, la estadfstica es 



s/4n 

que se distribuye segun una f-Student con 9 grados de libertad. 

4. Region critical Con el nivel de significacion a = 0.05 y para una prueba de 
hipotesis unilateral cola a la izquierda, en la tabla de probabilidades de t- 
Student se encuentra: / 095 9 = 1.833. 

Consecuentemente. Ia region critica es: RC - {T < -1.833} 

5. Cdlculosi De los datos de Ia muestra se obtiene: 

n = 10, x - 159, s = 2.309, error estdndar: sj yfn —0.13 



jc -160 159-160 




6. Decision : Dado que t k =-1.37 6? /?.C, debemos aceptar H 0 y concluir que la 
media de los ingresos quincenales no ha variado. 

NOTA. Utilizando el paquete de computo MCEST . se encuentra la probabilidad 
P=P[7<-1 .37]=0. 1012, por lo que debemos aceptar H 0 . 
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EJEMPLO 10.6. 

Un fabricante produce un cable de alambre de cierto tipo, que tiene una 
resistencia a la ruptura no mayor de 300 kg.. Se descubre un proceso nuevo y mas 
barato que desea emplearse, siempre que el cable asi producido tenga una 
resistencia media a la ruptura mayor de 300 kg.. Si una muestra aleatoria de 36 
cables producidos con el nuevo proceso ha dado una media 304.5 kg. y una 
desviacion estandar s =15 kg. ^Deberia el fabricante adoptar el nuevo proceso, 
si esta dispuesto a asumir un error tipo I del 5%?. 

Suponga que la distribucion de la resistencia a la ruptura es: 
a) Normal, b) Desconocida no normal. 

SOLUCION. 

Sea X la resistencia a la ruptura. 

Se debe probar la hipotesis nula f/ 0 :p<300 contra // 1 :p>300 al nivel de 
signification del 5% y a partir de una muestra de tamano: n = 36 . 

a) Si X tiene distribucion normal, la varianza a 2 es desconocida y si 300 

es realmente cierta, la estadistica de la prueba es: 



Para a = 0.05 y una prueba unilateral de cola a la derecha, en la distribucion 
/(35) se encuentra el valor critico: f 0950 35 =1-69 . 4 

Luego, la regi6n crftica es: RC = [T > 1.69} 

De los datos de la muestra, se tiene: 




7-300 304 5 - 300 

t 




Dado que, f* = 1.8 e KC. y se debe rechazar H 0 . 



b) Si X no se distribuye en forma normal, la varianza a 2 es desconocida, n > 30 , 
y si H 0 : p = 300 es realmente cierta, la estadistica es: 




X —300 



que se distribuye aproximadamente no rmal A/(0,1). 
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Para el nivel de signification a = 0.05 y para una prueba unilateral de 
cola a la derecha, en la distribution de Z se encuentra: z^ a = z 09 5 =1.645. 
Luego, la region critica es: 

RC = {Z> 1,645}. 

De la muestra aleatoria resulta: 

3c -300 304.5-300 , 0 

Z k = — 7 - 7 =- = = 1-8. 

s!*Jn 2.5 

Ya que z k = 1.8 e debemos rechazar H 0 y concluir que conviene 

adoptar el nuevo proceso. 



10.4 Pruebas de hipotesis acerca de una varianza 

Sea X, t X 2 ,...,X n una muestra aleatoria de tamano n, seleccionada de una 

poblacion normal con media p y varianza o 2 , parametros desconocidos, y sea la 
varianza muestral, 



S 2 = — 






n- 1 



Entonces, la variable aleatoria. 



X = 



C n-V)S 2 



tiene distnbucion chi-cuadrado con n - 1 grados de libertad. Esta estadistica se 
utiliza para probar hipotesis acerca de una varianza. 

Si se supone verdadera la hipotesis nula H 0 :o 2 = Qq , la estadistica es: 

O 0 
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Su valor x k = — — ^ — que resulta de la muestra aleatoria, se utiliza para la prueba 
c o 

de // 0 , contra una alternativa unilateral o bilateral. 

1) Prueba bilateral o de dos colas 

Si se prueba H 0 : a 2 = Gq contra H x : o 2 ^ , dado un nivel de significacion a, 

en la distribucion x 2 (' ?- 0 se determinan los valores Xa/2 n-i y X 2 -a/ 2 .«-i 
(figura 10.9) tales que la probabilidad de rechazar la hipotesis nula H 0 cuando 
real men te es verdadera es igual a: 

^*<X^„-,] = a/2 O P[X >X?-a/2.n-l] = ct /2. 

La Region critica de la prueba, es entonces, 

R C- = { X < Xa/2. n-1 0 ^ > X r-a/2. n-\ ) * 

La Regia de decision es rechazar H 0 con un riesgo a , si x k e R.C. ( o si 
x k & R.A . = [Xa/2,n-i’X?- a /2.n-i] )• No rechazar // 0 en caso contrario. 




2 *) 2 2 
Figura 10.9: Region critica para la prueba de H 0 : G = Gq contra H x : G * G 0 

2) Contraste unilateral de cola a la derecha.* 

Si se prueba H q :g 2 =Gq contra H v :g 2 >v\ y dado un nivel de 
significacion a, en la distribucion % 2 (n — l) se determina el valor xf-a.n-i (fig ura 

10.10) tal que la probabilidad de rechazar la hipotesis nula H 0 cuando realmente 
es verdadera es igual a: 

PIX > Xt a.n-l 1 = a - 

Luego, la region critica es: R.C ={X > y f_ ijt n _ . ] . 
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La regia de decision es: rechazar H 0 al nivel a si x k e R.C. (o si 

x k & R.A. = {X < xf-a. 1 ) )■ No rechazar H 0 , en caso contrario. 



X 

Figura 10.10: Region crftica para la prueba de //«: a 2 = ao contra //,: a 2 > 0 q 

3) Contraste unilateral cola a la izquierda. 

Si la prueba es de H 0 :o 2 =o^ contra H x :a 2 <Oq, dado un nivel de 
significacion a. en la distribucion x 2 ( /l ~ D se determina el valor Xa.„-i Oigura 
10.1 1) tal que la probabilidad de rechazar la hipotesis nula H 0 cuando realmente 
es verdadera es igual a: 

<Xa.# l -,] ==a - 

* 

Luego. la region crttica es: R.C. = {X < Xa «-i ) 





Figura 10.11 :Region critica para la prueba de H {) : o 2 = cTq contra H\ .o 2 < a 2 

Regia de decision: rechazar H 0 si x k e R.C. (o si x k g R.A. = {X > x^ «-i ) )• 
No rechazar H 0 en caso contrario. 
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EJEMPLO 10.7. 

En un proceso de fabricacion, se plantea la hipotesis que la desviacion estandar 
de las longitudes de cierto tipo de tornillo es 2.0 mm En una muestra de diez 
tornillos elegidos al azar del proceso de produccion se han encontrado las siguientes 
longitudes en milimetros: 

7 1 , 66, 64, 72, 69, 67, 70, 68, 65, 69. 

Con estos datos, £se justifica la suposicion que la desviacion estandar verdadera 
es 2.00 mm? 

Use el nivel de significacion a = 0.05, y suponga que la distribucion de las 
longitudes es normal. 

SOLUCION. 

1. Hipotesis : H 0 a 2 =4 contra //, :o 2 *4 

2. Nivel de signification : a = 0.05 . 

3. Estadistica : Poblacidn normal, con n = 10, y suponiendo verdadera la hipotesis 

H 0 : a 2 = 4 , la estadistica 



Y (n - 1)5 2 
4 

se distribuye como chi-cuadrado con 9 grados de libertad. 

4. Region critica : Para a = 0.05 y para un contraste bilateral, en la tabla chi- 
cuadrado se encuentran los siguientes valores crfticos: * 

Xa/2,n-l - X 0.02*, 9 = 2-70 
Xl-a/2.n-! = Xo.975.9 = 19.02. 



Luego, la region critica es: R.C. = (X < 2.70 o X > 19.02). 

5. Calculos: De los datos de ia muestra resulta s 2 = 6.77 , entonces. 



x k 



(n - 1)5 2 _ 9f 2 
4 ~~ 



9(6.77) 

4 



15.23. 



6. Decision: Como x k =15.23 e R.C. nose debe rechazar H 0 y concluimos que 
la varianza de Ia poblacion es igual a 4 gr 2 . 
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10.5 Pruebas de hipotesis acerca de la razon 
de dos varianzas 

Sean Sf y S 2 las varianzas de dos muestras aleatorias independientes de 
tamanos respectivos n } y n 2 , escogidas de dos poblaciones normales con 
varianzas respectivas cxf y cr 2 . Entonces, la estadfstica. 




tiene distribucion de probabilidad F con grad os de libertad r x =n x -\ y 
r 2 ~ n 2 ~ 1 • Esto es ^ F ~ F(r } , r 2 ) . Esta estadfstica se utiliza para probar igualdad 
de varianzas. 

Si se supone verdadera la hipotesis nula ^o :cr ] 2==cr 2 0 la 

estadfstica de la prueba es: 

S 2 

F»— ~F(r } ,r 2 ) 

S* 

Su valor f k = que resulta de dos muestras aleatorias, se utiliza para probar 

Si 

la hipotesis nula H 0 contra cualquier alternativa unilateral o bilateral 

Observar que para obtener la estadfstica F no se requiere asumir que las dos 
poblaciones tengan igual promedio. 

1) Prueba bilateral. Si se prueba H 0 = a 2 contra //, :o x * o\ , dado un 
nivel de significacion a, en la distribucion de F(r,,r 2 ) se encuentran los 
valores f a jZr } r 2 y /i- a /2,r, r 2 tales Q ue l a probabilidad de rechazar 
f/ 0 cuando realmente es verdadera es igual a (figura 10.12). 

PH 7 <f a /2.r l .rj = a / 2 O P[F > fl- a J2.r,.rJ = a /2 

Luego la region critica de la prueba es 

R.C. = { F < f aJ2 . . , 2 O F> f\- a /2. )■ 

La regia de decision es rechazar H 0 si f k e R.C. o si 
f k e. R.A. = lf a j 2 , n , r 2 . fi-afi, #■, r 2 1 ■ No rechazar H 0 en caso contrario. 
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7 2 2 7 

Figura 10.12: Region critica de la prueba de H t} : = a ^ contra //,: a, * 

2) Prueba Unilateral cola derecha. Si se prueba H 0 :o^=g\ contra 

H | > Oj » dado el nivel de significacion a, en la distribucion F(r ]9 r 2 ) se 

determina el valor /j_ a tal que la probabilidad de rechazar H 0 cuando 
real men te es verdadera es igual a; 

P[F>f 

Luego, la regidn critica de la prueba es: R.C. = { F > /,_ a ^ } 

La regia de decision es: Rechazar H 0 si f k eRC o si 

f k g R.A. =]-oc % /i_ a r r , ] . No rechazar H 0 en caso contrario 

* 

3) Prueba Unilateral cola izquierda. Si se prueba // o :0, 2 = 0 ; contra 

//, : a, 2 < 02 . dado e! nivel de significacion a, en la distribucion F(r, , r 2 ) se 
determina el valor f a ^ ^ tal que la probabilidad de rechazar H 0 cuando 
realmente es verdadera es igual a; 

P[F<f arur J = a 

Luego. la region critica es. R.C. = {Z 7 < f a .r v r, }• 

La regia de decision es: Rechazar si f k e R.C. o si 

f k e R.A. = {F > f a ^ } . No rechazar H 0 en caso contrario 
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EJEMPLO 10.8. 

Una compama disena un nuevo proceso de moldeo para reducir la variabilidad 
en el diametro de las piezas producidas. Se cree que la varianza del nuevo proceso 
es menor que la varianza del proceso antiguo. Para una muestra de 8 piezas del 
proceso antiguo y una muestra de 6 piezas del proceso nuevo se obtienen los 
siguientes diametros en milimetros: 

Antiguo: 17, 23, 21, 18, 22, 20, 21, 19. 

Nuevo: 13, 16, 14, 12, 15, 14. 

^Confirman estos datos que la varianza de los diametros con el nuevo proceso es 
menor que con el proceso antiguo?. 

Suponga poblaciones normales y use a = 0.05 . 

SOLUCION. 

Sean X , y X 2 las variables que representan los diametros de las piezas con 
el proceso antiguo y nuevo respectivamente. Las dos poblaciones se distribuyen 
normalmente con varianzas desconocidas respectivas a, 2 y <z\ 

1. Hipotesis : H 0 : a, 2 = o\ contra H t : of > . 

2. Nivel de signification : a = 0.05 . 

3. Estadistica : Poblaciones normales. Suponiendo verdadera la hipotesis nula H 0% 

para n x = 8 y n 2 =6,la estadistica de la prueba es: 




que se distribuye como F(7,5). 

4 Region critica . Para a = 0.05 y la prueba unilateral cola a la derecha, en la 
distribucion de F(7,5), la region critica es 

/?.C. = { F>4.88} 

5 Cdlculos . De los datos de la muestra se obtiene: 

s, 2 =4.125, s\= 2 y /*= j 2 /j| = 4.125/2 = 2.0625. 

6. Decision . Como f k - 2.065 € R.C. no se debe rechazar H 0 y concluir que 
las dos varianzas son iguales. 

NOTA Con el paquete de computo MCEST se obtiene la probabilidad: 
P[F>2.0625 ]=0.221, con la que se toma la decision que las dos varianza son iguales. 
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10.6 Pruebas de hipotesis acerca de dos medias 



10.6.1 Pruebas de hipotesis acerca de dos medias: 
Varianzas erf y <jj supuestas conocidas 

Sean X x y X 2 las medias de dos muestras aleatorias independientes dc 
tamanos n } y n 2 seleccionadas respectivamente de dos poblaciones 

independientes, con medias p, y n 2 y varianzas af y o\ respectivas supuestas 
conocidas. 

Si las dos poblaciones son normales , entonces, las estadfsticas X x y X 2 
tienen respectivamente distribucion normal af/zZ]) y N(\i 2l o\/n 2 ) P ara 

n x >2, y n 2 >2. Luego, la estadfstica X x -X 2 tiene distribucion exactamentc 
normal -\i 2 ,a] jn x +a\ln 2 ) . 

Si las dos poblaciones no son normales pero n x y n 2 son suficientemenie 
grandes ( «, > 30 y n 2 > 30 ), entonces, X x -X 2 tiene distribucion 

aproximadamente normal yV(p, -\x 2 ,o] jn x +G\/n 2 ). 

Luego, segun sean las dos poblaciones normales o no, la estadfstica 

Va\Jn 2 

tiene distribucion exactamente o aproximadamente normal N( 0, 1 ). 

Si suponemos verdaderd la hip6tesis nula // 0 :p, =p 2 0 Mi - P 2~0' l a 
estadfstica es: 

Zm 202k ~Af(0,l) 

VCT , 2 /«1 + ct 2 / n 2 

Su valor z * = — 7 A| = que resulta de dos muestras, se utiliza para probar 
yjo^/n\+al/n 2 

H 0 contra cualquiera de las hipotesis alternativas // , : p 1 ^ M 2 6 H t >p : d 
: Mi <M2 . 
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La estructura de la prueba es similar a los casos descritos en la seccion 10.2, 
usando la distribucion de Z. 

1) Prueba bilateral o de dos colas 

Si se prueba = P 2 contra //^Pj *p 2 » * a region crftica en el 

rango de variation de Z es: 



2) Prueba unilateral de cola a la derecha 

Si se prueba H 0 p, = p 2 contra H\ Pi >p 2 * * a region crftica en la 
variation de Z es. 



3) Prueba unilateral de cola a la izquierda 

Si se prueba H 0 :p] = p 2 contra //, :p, <p 2 , ^ a region crftica en los 
valores de Z es: 



NOTA. Cuando las hipotesis son de la forma 

1) H 0 :pi -p 2 contra //, : p, - p 2 * do 

2) H 0 :p, -p 2 contra H } :pj -p 2 ><r / 0 

3) // 0 :p 1 “P 2 =r/o contra H x : p, -p 2 <d 0 

La estadistica de la prueba es. 



cuya distribucion es exactamente o aproximadamente normal A(0,1), segun sean las 
dos poblaciones normales o no. 

EJEMPLO 10.9. 

Un fabricante quiere comparar dos marcas de maquinas, A y B para fabricar un 
tipo de articulo. Observa dos muestras aleatonas de 60 artfculos procesados por A 
y B respectivamente y encuentra que las medias respect! vas son L230 v 1.190 
segundos. 



R.C. — [Z < —Z\- a j 2 o ^> 1 - 0 / 2 )* 



R.C. = {Z > Z ]_ a }. 



R.C. = \Z <-Z\- a }■ 



(x, -X 2 )-d 0 
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Suponga Cj = 120 y a 2 =90 segundos. 

a) A1 nivel de signification del 5%, £se puede inferir que la maquina B es mas 
rapida que la maquina A?. 

b) A1 nivel de signification del 5%, 6 se puede inferir que la media de B es menor 
que la media de A en menos de 7 segundos?. 

c) ^En cuanto deberian incrementarse los tamanos de las muestras de cada 
proceso para que la diferencia observada de 40 segundos en los tiempos 
promedios muestrales de A menos B sea significativa al nivel a=l%? 

SOLUCION. 

Sean X x y X 2 los tiempos de proceso con las maquinas A y B 
respectivamente y pj y p 2 sus me di as respectivas. 

Se desconocen las distribuciones de probabilidades de X x y X 2 , pero las 
muestras son grandes. 

a) \. Hipotesis: H 0 :p 1 =p 2 contra H { >p 2 

2. Nivel de signification, a = 0.05 

3. Estadistica : Si se supone verdadera la hipotesis H 0 y para muestras grandes, 

la estadistica apropiada es: 

Z = ~^2 

7(af/n,)+(al/n 2 ) 

cuya distribuci6n es aproxi mad amen te normal estandar N(0,1). 

4„ Region critical Para a = 0.05 y una prueba unilateral de cola a la derecha. en 
la distribution de Z se encuentra el valor z 0 9500 = 1 -645 . Luego, la region 
cntica es, 

R.C.={Z> 1.645}. 

5. Cdlculos: De los datos se tiene 

n \ ~ n 2 = 60 . Xj = 1,230, x 2 = 1 190 , cf, = 120 y a 2 = 90 

£.5=Error estandar =^{ct, 2 /n x )+ [ol/n 2 )= 19.365 



x x -x 2 
k ES 



1,230-1,190 

19.365 



2.07. 
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6. Decision: Ya que Zfc = 2.07 e R.C., debemos rechazar H 0 y concluir que el 
equipo B utiliza menor tiempo en el proceso de fabrication. 



b) Sedebe probar H 0 : |a j -p 2 = 7 contra H ] :p, -p 2 >7 - 
Si H 0 es verdadera, la estadistica de la prueba es 



•, (x,-X 2 )-7 

V(°i7«i )+(o|/« 2 ) 



~ /V(0, 1) 



La region critica de la prueba unilateral cola derecha al nivel a = 0.05 es: la 
misma del caso a) 



/?.C.={Z> 1.645}. 



(5c, -I,)-7 (1230-1 190)-7 , „ 

Zv — — =1.7. 

* ES 19.365 

Ya que z k = 1.7 e /?.C, debemos rechazar y concluir que la maquma 

B utiliza un tiempo promedio menos de 7 segundos debajo del tiempo promedio 
de A. 



c) Sea n el tamaho de cada una de las dos muestras tomadas de los articulos 

procesados por las maquinas Ay B 

Si la hipotesis nula// 0 es verdadera, y si ademas 

5c, -x 2 =1230-1190=40, 

40 i — 

se tiene - = Q.llyjn , 

| l20 2 + 90 2 

Para a = 0.01 y una prueba unilateral de cola a la derecha, en la distribucion de 
Z sehalla: 

M-a ^0.99 2 33 . 

La region critica es: R.C = [Z > 2.33} 

La diferencia observada de 40 en las medias de las muestras sera significativa al 
nivel de 1%, si 

0.27 -Jn e R.C. 

Esto es, si 0.27 -Jn > 2.33, ifn > 8.63, n > 75. 

De aquf que se debe incrementar cada muestra en al menos: 75 - 60 = 15 casos 
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10.6.2 Pruebas de hipotesis acerca de dos medias: 
Varianzas cj’ y supuestas desconocidas 



A) Poblaciones no normales 

Si las dos muestras aleatorias independientes de tamanos n : y n 2 se 
seleccionan respectivamente de dos poblaciones cuyas distributions s son no 
normales con varianzas of y 02 supuestas desconocidas , entonces, siempre que 
los tamanos de las muestras sean grandes; n } > 30 y n 2 > 30 los parametros 

o, y o 2 se estiman respectivamente por s } y s 2 - 

Para probar la hipotesis nula H 0 : pj -p 2 = 0 contra una alternativa bilateral o 
unilateral, se utiliza la estadistica: 

Z - 1 ~ % 2 )"^ l ~ P2 ) 

yjsf/rii +sl/n z 

que se distribuye aproximadamente normal /V(0,1). 

Las regiones criticas y las reglas de decision para las pruebas de la hipotes ; s 
nula H 0 :pi -p 2 (fi H 0 : Pi _ P 2 -d 0 ) contra una alternativa unilateral o 
bilateral son las mismas del metodo con varianzas conocidas. 

B) Poblaciones normales 

Sean X [ y X 2 las medias y S j 2 y S , las varianzas de dos muestras 

aleatorias independientes de tamanos n } y n 2 respectivamente seleccionadas de 

dos poblaciones normales con medias pi y p 2 y varianzas ex 2 y a 2 
desconocidas. 



B 1 ) V arianzas desconocidas supuesta iguales : a f = a \ =a 2 

Si las poblaciones son normales, independientes, y con varianzas desconocidas 
supuestas iguales, entonces, la estadistica 



T = 



_ (^1 ~ X 2 )*~ (Pi “P2) 
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tiene distribucion f-student con n } + n 2 - 2 grados de libertad, en donde la 
varianza comun: 



que resulta de dos muestras aleatorias, se utiliza para probar H 0 contra una 
altemativa unilateral o bilateral. 

La estructura de la prueba es similar a los casos descritos en la seccion 10.3, 
usando la distribucion de t. 

1) Prueba bilateral o de dos colas 

Si se prueba H 0 :pj = p 2 contra //, :p x *p 2 , region critica es el 



2) Prueba unilateral de cola a la derecha 

Si se prueba H 0 :p, = p 2 contra H x :p, >p 2 , la region critica es el 



3) Prueba unilateral de cola a la izquierda 

Si se prueba H 0 :p, =p 2 contra H x :p, <p 2 * region critica es el 



(n x -1) S 2 + (n 2 -1)S| 




n \ + n 2 “2 

es un estimador insesgado de la varianza comun a 2 . 

Si la hipotesis nula H 0 : pj = p 2 es verdadera, entonces, la estadistica 




Su valor 




intervalo:, 



R.C. = {T<-t 




intervalo: 



R.C={T>t ] 






intervalo: 
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R.C. = {T <— r. 



l-a./ij+Mi 



,-2) 



B2) Varianzas desconocidas supuestas distintas G 2 ^ G 2 

Si las varianzas de las dos poblaciones normales independientes son 
desconocidas supuestas diferentes, entonces, la estadfstica 



^ (x, -X 2 )-(^, ~^ 2 ) 

•^5, 2 /n, + 5f Jn 2 

tiene distribution /-student con r grados de libertad, siendo 

r =- — 



Dado que r rara vez es un entero, se redondea al entero mas cercano 
Si la hipotesis nula H 0 :\x , = ji 2 se supone verdadera. entonces 




T = 



X x -X 2 

V^) 2 /' 1 , + Sl/ n 2 



t(r) 



Su valor t k = . . " V| . . - 2 -- - - - que resulta de dos muestras aleatorias 
//I, + $7 ,? 2 

independientes, se utiliza para probar H 0 contra una alternative unilateral o 
bilateral. 

Las regiones crfticas y las reglas de decision soil similar es a los del caso Bl, 
pero con r grados de libertad. 



EJEMPLO 10.10. 

Una medicina A es aplicada a 10 pacientes aquejados de cierta enfermedad. 
Otra medicina B es aplicada a otros 9 pacientes aquejados de la rrnsma enfermedad. 
Los tiempos de recuperation de los pacientes. en dias, fueron los siguientes: 

Medicina A: 6, 5, 6, 7, 4, 7, 6, 4, 3, 6. 

Medicina B: 7, 6, 7, 9, 5, 8, 7, 6, 8. 

UtHizando un nivel de signification del 5% y supomendo poblaciones normales. 
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a) ^Se podria concluir que las varianzas poblacionales son iguales? 

b) ^Se puede aceptar la hipotesis nula que son iguales las medias de los tiempos de 
tratamiento de las dos medicinas?. 

c) ^Cual de las medicinas es mas eficaz? 

SOLUCION» 

Sean y X t las valuables aleatorias que representan los tiempos en dias 
de tratamiento de las medicinas A y B respectivamente. Se supone que 
X, - N(n,,a, 2 ) y X 2 ~ N(h 2 ,c^). 

a) Prueba ue la homogeneidad de varianzas 

1 . Hipotesis : H 0 : CF| 2 = o\ contra H { : of * a? 

2. Nivel de significacion : a = 0.05 . 

3. Estadistica : Poblaciones normales. Suponiendo verdadera la hipotesis nula 

H^ , para n x - 10 y n 2 ~ 9 . la estadistica de la prueba es: 




que se distribuye como F( 9, 8). 

4 Region critica . Para a = 0.05 y una prueba bilateral, en la distribution de 
F( 9,8) se encuentran: 

0 975 9 8 “4.36 y /0 025.9.8 = V/o.975.8.9 = ^ 4.10 = 0.244 
Luego, la region entica esta dada por: 

R.C. = {F < 0.244 o F > 4.36} . 

5. Cdlculos. De los datos de la muestra se obtiene* 

i, 2 = 1 .822, i 2 2 = 1.5 y f k = if /if = 1.215. 

6. Decision. Como f k = 1.215 £ R.C. Se deberia aceptar H 0 y concluir que 

las varianzas de los tiempos de A y B son iguales. 

b) Prueba de la difcrencia de las dos medias* 

1 .Hipotesis: // 0 :ni = n 2 contra H x :p, ^p 2 _ 

2. Nivel de significacion: a = 0.05. 

3. Estadistica de ia prueba: Si se supone H 0 verdadera y dado que hay prueba 

de que las varianzas poblacionales son iguales, la estadistica apropiada es: 
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que se distnbuye segun una r-Student con + n 2 - 2 = 17 grados de 
libertad. 

4. Region critica : Para a = 0.05 y una prueba de hipotesis bilateral, en la 
distribution r(17) se encuentra t x _ a f 2 n ^ n ^ 2 = r o. 975 .i 7 =2.110. 

La region critica en la variation de T es 

R.C. ={ T < -2.1 10 o T>2.\ 10}. 

5. Calculos . De los datos se tiene: 

rtf =10. .7, =5.4. s? =1.822. n 2 =9. 7, =7.0. if =1.5. 

. (n, -l)ff +(n, -1)7? 9(1 .822) -t- 8(1 .5) 

+ n 2 ~2 10 + 9-2 



Error estandar = 




0.594 



0 =- 



-v, - 






5.4 -7.0 
0.594 



= -2.694. 



6. Decision : Ya que = —2.694 e R.C. y debemos rechazar H 0 y concluir que 

los promedios de los tiempos de tratamientos con las medicinas A y B son 
diferentes. 



c) Como las medias de las dos poblaciones son diferentes. planteamos las hipotesis: 
f/ 0 : p, = (Ambas medicinas son iguales). 

H x :p, <p 2 (Medicina A es mejor que B). 

Con a=0.05y 17 grados de libertad, para !a prueba unilateral de cola a la 
izquierda se encuentra el valor critico: r 095 , 7 = 1.740. Luego, la region 

critica es: 

R.C. = { T < — 1 .740 }. 

Como t k =-2.694 e R.C., debemos rechazar H 0 y concluir que la 
medicina A mas eficaz que la medicina B 
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NOTA. Con el paquete MCEST para la prueba de varianzas se obtiene: 
P[F>1.215]=0.397 . Dado que 0.397>0.05 se infiere que las varianzas poblacionales 
son iguales al nivel 5%. 

Tambien para la prueba de dos medias se obtiene P[T > 2.694]=0.007. Luego, 

0. 007. es la signification para una prueba unilateral y 2(0.007)-0.014 para una 
prueba bilateral. Por lo que se debe rechazar H 0 c n una prueba unilateral o bilateral 
al 5%. 

EJEMPLO 10.11. 

El encargado de compras de una companfa tiene que escoger entre dos marcas 
de maquinas A y B, para procesar cierto producto. Por cuestiones de precio el 
encargado deseana comprar la marca A a no ser que haya evidencias de que la 
maquina B es mas veloz. Se le permitio operar los dos tipos de maquinas durante un 
periodo de prueba, escogiendo al azar luego. los tiempos en segundos de 10 objetos 
procesados por cada maquina: 

Maquina A: 55, 56, 57, 56, 58, 53, 54, 59, 60, 57 
Maquina B: 50, 5 1, 42, 50, 40, 60, 53, 44, 48, 58 

Utilizando un nivel de signification del 5% y suponiendo poblaciones de tiempos 
normales. 

a) <rSe podria concluir que las varianzas poblacionales son iguales? 

b) ^Que tipo de maquina deberia comprar la empresa?. 

SOLIJCION. 

Sean X { y X 2 las variables aleatorias que representan los tiempos 
empieados por las maquinas A y B respectivamente. Se sabe que X x ~ N(\x x , a 2 ) 

y x 2 ~ N(p 2 ,G 2 ). 

a) Prueba de la homogeneidad de varianzas 

1. Hipotesis : H 0 : a 2 = g\ contra //, : o, 2 ^ a \ . 

2. Nivel de signification: a - 0.05 . 

3. Estadistica : Poblaciones normales. Suponiendo verdadera la hipotesis nula H 0 , 

para =10 y az 2 =10,l a estadistica de la prueba es: 




que se distribuye como F(9, 9). 

4. Region eritica. Para a = 0.05 y una prueba bilateral, en la distribution de 
F(9,9) se encuentra: 
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/ 0 . 975 . 9.9 ~ 4.03 y / 0025 . 9.9 - V / 0 . 975 . 9.9 - I / 4-03 - 0.248. 

Luego, la region critica esta dada por: 

F.C. = { F < 0.248 o F > 4.03}. 

5. Calculos. De los datos de la muestra se obtiene: 

s, 2 = 4.722, = 41.822 y /* = s 2 fs\ = 4.722/41.822 = 0.1 129. 

6. Decision. Como /* = 0. 1 1 29 € R.C. se debe rechazar // 0 y concluir que las 

varianzas de A y B son diferentes. 



b) Prueba de diferencia de las dos medias: 

1. Hipotesis: H 0 : p, = p 2 (Los promedios de tiempos de A y B son iguales) 

tf 0 :Pi > p 2 (La maquina B liene mejor tiempo promcdio) 

2. Nivel de signification: a = 0.05 

3. Estadistica de la prueba: Si se supone // 0 verdadera y dado que hay prueba dc 

que las varianzas poblacionales son diferentes, la estadistica apropiada es: 



F = 



X, -X 2 



W/»l +^ 2 /«2 



que se distribuye segun una r-Student con / grados de libcrtad donde: 



\s\ iA 


1 + ^2 /«2 ] 


[?. 2 A. ] 


u 


fih'ii 



rc, -1 n 2 — 1 



[4.7yi0.4l. 8 2/< =|[0()7a|| 
[4.72/l0]" [41.82/10]" 

~~9 + 9 



4. Region critical Para a = 0.05 y una prueba unilateral de cola a la derecha, en la 
distribution r(l 1) , se encuentra r,_ a r = / 0 95 ,, = 1-796. La region critica en la 

variation de T es 



R.C. = {T > 1.796} 



5. Calculos: De los datos se tiene tambien: 

5c, = 56.5 , x 2 = 49.6, 3c, - 3t 2 = 6.9 , 



E.S = Error eslandar 




= 2.1574 
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6.9 

2.1574 



= 3.198. 



6 Decision : Ya que t k =3.198 e/?.C., debemos rechazar H 0 . Concluimos que se 
debe adquirir la maquina B. 



NOTA. Con el paquete MCEST se obtiene: P[F > 8.856]=0.003 eon la que se 
rechaza la afirmacion de que las varianzas poblacionales son iguales. 

Tambien se obtiene P[T > 3.198]=0.004 que nos lleva a rechazar H 0 t n una 
prueba unilateral. 



10.7 Prueba de la diferencia entre dos medias 
con observaciones aparejadas 

Sea (Xj.Y,). (X 2 ,Y 2 )»•••» una muestra aleatoria de n datos 

aparejados, donde las muestras X l% X 2 ,~., X n , e Y^Y 2 Y n , correlacionadas. 

son seleccionadas respectivamente de dos poblaciones normales X ~ N([i j,cjf) y 
Y ~ N(n 2 ,aj) . 

Podemos concebir estas n diferencias: 

d 2 = x 2 - y 2 D„ = x n -y„ 

como una muestra aleatoria seleccionada de una poblacion de diferencias 
D-X-Y cuya distribucion es normal /V(|a D , o 2 D ) , con media Po = l Ll i _ *l a 2 y 
varianza o 2 D = of +o \ -2cov(Y, Y ) . 

Si es conocida, la estadfstica D, media de las diferencias, tiene 

distribucion normal jV(ja D , jri) . Consecuentemente la estadfstica: 

P -(H, -|a 2 ) 

tiene distribucion normal ^(0,1). Esta estadfstica Z se utiliza en la prueba de dos 
medias correiacionadas cuando la varianza q 2 d es conocida. 
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Por otro lado, si es desconocida , entonces, la estadistica. 



i -M2) 

So l Si 



tiene distribucion t-student con n — 1 grados de libertad, en la que 



n 



X (D < _D)2 




Esta estadfstica T se utiliza en la prueba de dos medias correlacionadas cuando 
lavarianza es desconocida. 

Si H 0 : ju D = jii - p 2 = 0 se supone verdadera, la estadistica es: 



de una muestra aleatoria correlacionada, se utiliza para probar H 0 :p D =0 contra 
cualquierade las altemativas; //, :^i D *0 6 H x :\x D >0 6 0 

Las regiones cnticas y las regia s de decision de esta prueba /, son similares 
a Ips de laseccion 10*3 

EJEMPLO 10.12. 

Un administrador esta probando la posibilidad de usar un nuevo paquete de 
computacion. Cambiara de paquete si hay prueba que el nuevo usa menos tiempo 
que el antiguo al procesar determinada tarea. A fin de tomar una decision se 
selecciona una muestra aleatoria de 7 operadoras y se registra el tiempo de 
procesamiento en segundos con ambos paquetes tal como se da en la tabla que 
sigue. A partir de estos datos, ^se cambiara el paquete de computo antiguo por el 
nuevo?. Use un nivel de significacidn del 5% y haga las suposiciones necesarias. 




5 



Su valor t k 




que resulta 



SOLUCION. 



1. Hipotesis: H 0 : \i D =0 contra //, :\x D >0. 
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2. Nivel de signification : a = 0.05. 

3. Estadistica de la prueba: Se suponen poblaciones normales. Si la hipdtesis nula 

es verdadera, entonces para n — 7 , la estadistica es 



■SdA/h 

que se distribuye segun una f-Student con n - 1 = 6 grados de libertad. 



Operadora 


Paquete 

antiguo 


Paquete 

nuevo 


Diferencia 

di 


df 


1 


10 


6 


4 


16 


2 


10 


10 


0 


0 


3 


15 


12 


3 


9 


4 


12 


8 


4 


16 


5 


16 


15 


1 


1 


6 


14 


16 


_2 


4 


7 


16 


12 


4 


16 


Total 






14 


62 



4. Region critica : Para a = 0.05 y la alternativa unilateral cola derecha en la 
distribucion t{6) se halla el valor crftico f,_ a w _, =t 095 6 =1.943. La region 
critica en la variacion de T es el intervalo: 

R.C. -{T > 1.943} 

- 14 

5. Calculos: De los datos se tiene: n=7, d = — = 2, 

7 

error estandar: s d /4n = 0.8996 



d 2 

k 0.8996 



2 . 22 . 



6 Decision’. t k = 2.22 e/?.C., debemos rechazar // 0 . 



NOTA. Con el paquete estadfstico MCEST se obtiene la probabilidad 

P=P[T > 2.22]=0.033. 
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10.8 Prueba de hipotesis acerca de proporciones 
10.8.1 Una sola proportion 

Sea X x y X 2 >...,X n una muestra aleatoria de tamano n escogida de una 
poblacion Bernoulli B(\ y p ), donde el parametro desconocido p es la proporcion de 
exitos en la poblacion, y sea la estadistica, 

-_ X,+X 2 +... + X„ X 
n n 

la proporcion de exitos en la muestra , siendo X el numero de exitos en la muestra 
La estadistica X tiene distribution exactamente binomial B(n y p ) . 

Si n es suficientemente grande (n > 30) , la estadfstica 

X-ftp = P-p 

p) yfp(\^p)/n 



tiene distribucion aproximadamente normal MO, 1 ). 

Si se supone verdadera la hipotesis nula H 0 : p = p 0 , entonces, la distribucion 
muestral de X es exactamente binomial B(n y p 0 ) , y la de la variable aleatoria 

z X-np Q _ P-p o 

V n PoO-p 0 ) VpoO-Po)/" 

es aproximadamente normal N(Q,\)- 
La estadistica 



Zi = 



x - np 0 



P~P o 



Po) a/poO- Po)/ n 



valor calculado a partir de una muestra aleatoria de tamano n se utiliza para probar 
H 0 : p — Pq , contra una alternativa unilateral o bilateral. 



Las regiones criticas y las reglas de decision de esta prueba Z son similares a 
Jos de la section 10.2 
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1) Prueba bilateral. Si la prueba es de H 0 : p = p 0 contra //, : p * p 0 , la region 
crftica en los valores de Z es el intervalo: 

R C. = {Z < ~~Z\- (X f 2 o Z > Z\- a j 2 } 

2) Prueba unilateral cola derecha. Si la prueba es de H 0 : P = Po contra 
H y : p > p 0 , la regidn crftica en los valores de Z es el intervalo: 

R.C. = {Z > Zj_ a } 

3) Prueba unilateral cola izquierda. Si la prueba es de H 0 : p = p 0 contra 

Hy : p < p 0 , la region crftica en los valores de Z es el intervalo: 

/?.C. = [Z < -Z \- a } 



NOTA. A1 sustituir la variable 7 = - ■ — ■ P°- en R.C. se 

yjnpoO - Po) V A)0 “ Po)/ n 

obtienen las regiones crfticas respectivas en los valores de las variables X y P 
respectivamente. 



NOTA. (Muestras pequenas) Sea x la cantidad de exitos en una muestra aleatoria 
pequefia de tamano n (n<30) 

Prueba bilateral. Si x < np 0 se calcula 



P = P[X <x cuando p = p 0 ) = '£ i C’' k p£(\- p 0 ) n k 

k=0 



y si x > np 0 se calcula 

" n 

P = P[X > x cuando p = p 0 \ = ^ p^ (1 - p 0 )"~ k . 

*= X 

Se rechaza H 0 : p = p 0 si P < a/2 . En caso contrario no se rechaza H Q . 

Prueba unilateral cola derecha . Se calcula 



n 

P = P[X>x cuando p = p 0 J = ^ Po (1 - p 0 )"~ k 

k-x 

y se rechaza H 0 : p= p 0 si el valor de P es menor o igual que el nivel de 
significacion a . 
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Prueba unilateral cola izquierda. Se calcula 

r 

P=P[X <x cuando P = P 0 ] = XC* Po0~ Po)"~ k 

*=o 

y se rechaza H 0 : p = p 0 , si el valor de P es menor o igual que el nivel de 
significacion a . 

EJEMPLO 10.13. 

Un fabricante afirma que el 30% de todos los consumidores prefiere su 
producto. Con el fin de evaluar esta afirmacion se tomo una muestra aleatoria de 
400 consumidores y se encontro que 100 de ellos prefieren dicho producto. 

a) ^Es esta, suficiente evidencia para inferir que el porcentaje de prcferencia del 
producto no es 30%?. Utilice el nivel de significacion del 1 %. 

b) Calcular la probabilidad de to mar la decision errada de accptar la afirmacion del 
fabricante cuando la verdadera proporcidn poblacional de aceptacion del 
producto es 20 %. 

SOLUCION. 

a) Sea p el porcentaje poblacional de preferencia del producto. 

1 . Hipotesis: H 0 : p = 0.30 contra f/, : p^0.30 

2. Nivel de significacion a = 0.01 

3. Estadistica : Si H 0 : p =0.30, es verdadera, y n grande la estadfstica: 

P-p 0 P-0.3 

>/ ~Po (1 ” ~Po )/ n V°-3(0 7)//j 

que tiene distribucion aproximadamente normal N(0,\)- 

4. Region critica : Para a =0.01 y una altemativa bilateral, en la 

distribucidn de Z se encuentra el valor critico C 0995 =2.575. Luego. la 
region cntica es el intervalo: 

tf.C. = (Z< -2.575 o Z> 2.575}. 

x 1 Of) 

5. Calculo: n = 400, * = 1 00, p = - = = 0.25 

n 400 

ES = Error estandar = ^/p 0 (l - p 0 )/« = VO-3xG.7/400 = 0.0229 
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^,0.2 S-0.3 = .2„ 

ES 0.0229 

6. Decision : Como z k = -2.18 g R.C . , no debenamos rechazar // 0 , y concluimos 
que el fabric ante tiene la raz6n. 

b) A1 sustituir en R.C. la variable 

z P-Po P-0-3 

yfpoO- Po)/« 0.0229 

se obtiene la region critica en la variable P : 

PC. = {P <0.241 o P> 0.359} 

Luego, la probabilidad de aceptar H 0 : p = 0.30 cuando realmente p =0.20 (error 
tipo II) es igual a: 

p = P[ aceptar H 0 1 p = 0.20] = P[0.24 1 < P < 0.359 / p = 0.20] 

n „ 0.241-0.20 p-0.20 0.359-0.20 

0.02 ^/(0.2x0.8)/400 0.02 

(5 = P[2.05 < Z < 7.95] = 0.0202 

EJEMPLO 10.14 

Se afirma que cierto medicamento que se prescribe para aliviar determinada 
enfermedad es efectivo en mas del 80% de los casos. A1 parecer esta afirmacion es 
exagerada por lo que se suministra tal medicamento a una muestra aleatoria de 15 
pacientes resultando que 13 de ellos han cxperimentado alivio, ^es esta suficiente 
evidencia para concluir que realmente el medicamento es efectivo en mas del 80% 
de los casos al nivel de significacion del 5%?. 

SOLUCION 

Sea X el numero de pacientes que se sanan en n = 15 casos. Entonces X - P(15, p) 

donde p es el porcentaje de pacientes que se sanan en la poblacion de todos los 
pacientes que sufren la enfermedad. 

1. Hipotesis : H 0 : p- 0.80 contra //, : p > 0.80 . 

2. Nivel de significacion. a = 0.05 . 

3. Estadistica: Si la hipotesis nula es cierta, la variable X tiene distribucion binomial 

con n- 15 y p = 0.8 . 
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4. Region critical Se rechazara H 0 en favor de H ] si el valor de 
P = P[X >13 cuando p = 0.80] es menor que a = 0.05 

5. Calculo: 

15 

P = P[X> 13 Ip = 0.80] = ^ (0.8)* (0.2) 15- * = 0.3970. 

*=13 

6. Decision : Dado que P - 0.3970 > a = 0.05 , no se debe rechazar H 0 



1Q.8.2 Dos proporciones con observaciones 
independientes 



Sean X, y X 2 el numero de exitos en dos muestras aleatorias independientes de 
tamanos n x y n 2 seleccionadas respectivamente de dos poblaciones dc Bernoulli' 
y B(\,p 2 ), donde los parametros desconocidos p x y p 2 son las 
proporciones de exitos poblacionales respectivos. 

Sean ademas las proporciones de exitos muestrales respectivas: 



- X, - X, 

h — l - y Pi — - 

n 2 

Para n { y n 2 suficientemente grandes ( n } > 30 y n 2 > 30 ) , la variable 
aleatoria 



Z = 



P\ ~ P 2 -(P)-Pl) 



) P.0- 

V ”1 



Pi) + Pi. 0 Pi ) 



tiene distribucidn aproximadamente normal 7/(0, 1). 

Si H 0 : p } = p 2 se supone verdadera, la estadistica es; 

Pi -Pi 



1 



PcO- Pr) , Pc^-Pi > 



= ^( 0 , 1 ) 
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donde, p c es el valor comun de los parametros p } y p 2 cuya estimation 
insesgada (probar!) es: 



"iPl +" 2^2 

P- = 

n \ + w 2 n \ + n 2 



La estadistica 



Zir = 



[Jo 1 

V «. 



pi — Pi 

-p) , pd-p) 



valor que resulta de dos muestras aleatorias, se utiliza para probar la hipotesis nula 
// 0 : P\ - Pi> contra una alternativa unilateral o bilateral. 



Las regione^ crfticas y las reglas de decision de esta prueba Z son similares a 
los de la section 10.2 

1) Prueba bilateral. Si la prueba es de H 0 : p Y = p 2 contra //,:/?, * p 2 , la 
regidn critica en los valores de Z es el mtervalo: 

R.C. = [Z < -Zj-ot/2 O Z > Z\_ a f2 } 



2) Prueba unilateral cola derecha. Si la prueba es de H 0 : p ] = p 2 contra 
H } : Pi > p 2 , la region critica en los valores de Z es el intervalo: 

R.C. = {Z > Zj_ a } 

3) Prueba unilateral cola izquierda. Si la prueba es de H 0 ' P\~ contra 
H x : pj < p 2 , la region critica en los valores de Z es el intervalo: 

R.C. = {Z < -Zj_ a } 



EJEMPLO 10.15. 

Un patrocinador de un programa especial de television afirma que el programa 
representa un atractivo mayor para los televidentes hombres que para las mujeres, 
pero, el personal de produccion del programa piensa que es igual el porcentaje de 
televidentes hombres y mujeres que ven el programa ■ especial Si una muestra 
aleatoria de 300 hombres y otra de 400 mujeres reveld que 120 hombres y 120 
mujeres estaban viendo el programa especial de television, ^puede considerarse 
significativa la diferencia al nivel a = 5%? 
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SOLUCION. 



Sean p x y p 2 , respectivamente, las proporciones de hombres y mujeres que 
ven el programa especial de television. 

1. Hipotesis H 0 : p x = p 2 contra H\ : p, > p 2 

2. Nivel de significacion: a = 0.05. 

3. Estadistica. Si H 0 p, = p 2 es verdadera y las muestras son grandes, la 
estadistica es: 



Z = 



P - Pi 



lM+M 

V n \ n 2 



que tiene distribution aproximadamente normal /V(0,1 ). 

4. Region critica. Para a = 0.05 y una prueba unilateral cola a la derecha, la region 

cntica es: 

R.C. ={Z> 1.645} 

5. Calculo. Los datos de la muestra dan 



Hombres 

=300 

p x =120 



~P X = — — = 0.4 , 
1 300 



mujeres 
n 2 = 400 
P,=I20 

- 120 n , 

p-, = = 0.3 

‘ 400 



120+120 

p = 0.34 

300+400 



E5=Error eaandar = IM+M . =a036l8 

V n t n 2 v 300 400 



P\-p 2 0.4 -0.3 



= 2.764 



ES 0.03618 

6. Decision: Como z k = 2.764 e R.C . , deberfamos rechazar H 0 . 
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EJERCICIOS 



Error tipo I y error tipo II 

1. Halle la region de rechazo de la prueba de la hipdtesis nula: // 0 : p = 20, contra 

f/, : p * 20 correspond iente a la media de una poblacion con vananza o 2 = 16 . 
Suponga a = 0.05 y n > 30 . 

2 . Halle la region de rechazo de la prueba de la hipotesis H 0 : p = 50 contra 
//, :p < 50 donde p es la media de una poblacion normal con varianza a 2 
desconocida. Se dan rx- 9 y a = 0.01 . 

3. De una poblacion normal con media p y varianza 256 se extraen muestras 

aleatorias de tamano 16. Si para comprobar la hipotesis nula H 0 : p = 60 contra 
//, : p = 75, se utihza a = 0.05, hailar p. Rp p = 0.0174 

4 .. Para comprobar la hipotesis nula H 0 p = 50 contra H x ; p * 50 , donde p es la 
media de una poblacidn con desviacion estandar 18, se extrae una muestra 
aleatoria de tamano 36. Si se utiliza la region de aceptacion: 43 < X < 57, 
a) Hailar a, b) Hailar p si realmente p = 63 

Rp a) a = 0.0198., b) P = 0.0228. 

5. Una urna conuene 7 bolas de las cuales r son rojas y el resto azules. Para probar 

la hipotesis H 0 : r = 2 contra H { : r > 2, se extraen 2 bolas de una en una sin 
reemplazo y se rechaza H 0 si ambas bolas son rojas. 

a) Hailar a de la prueba 

b) Hailar p cuando r = 3 

Rp. a) a=P[ambas rojas / r=2)=0.0476. b) P=P[ ambas NO rojas / /=3]=0.857 

6. El numero de cheques sin fondo que recibe por dfa un banco es una variable 
aleatoria X que tiene distribucion de Poisson con parametro X. Si para 
comprobar la hipotesis H tt : X =5, versus H y : X = 3, se usa la region de critica 
RC = [X < 2 }, 

a) hailar la probabilidad de error tipo I. 

b) hailar la probabilidad de error tipo II. 

Rp. a) a=f[X< 1/X=5]=0.04, b) p=P[X >2A=31=0.8. 
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7. Se ha determinado que el tiempo de operation de un sistema entre una falla y la 
siguiente tiene distribution exponencial con una media de 10 horas. Se teme que 
el tiempo medio entre dos fallas consecutivas ha bajado a 8 horas. Para 
comprobar estas hipotesis cada cierto tiempo se hace una medicion del tiempo 
X entre dos fallas consecutivas y se decide que si X < 9 horas se acepta que el 
tiempo medio entre fallas ha disminuido a 8 horas, de otro modo se acepta que 
el tiempo medio entre dos fallas consecutivas es 10. 

a) Calcule el nivel de signification de la prueba. 

b) Calcule la probabilidad de error tipo II. 

Rp. a)W n :p=10, W,:p^8, ol=P[X<9 / p=10 ]=I-e" w, ° = 0.593. b) P=P[X>9/p=8]=e' y *= 0.325 



Una media 

8 . Un productor de capsulas de una de gato afirma que la demanda promedio de su 
producto en el mercado es de 1000 capsulas diarias. Sin embargo, un estudio 
de la demanda de su producto en 36 dias aleatorios da una media y una 
desviacidn est&ndar de 850 y 360 capsulas diarias respectivamente. ^es esto 
suficiente evidencia para contradecir la afirmacion de este productor?. Utilice el 
nivel de signification a = 1 .5% en una prueba unilateral. 

Rp. W 0 : p >1.000, W, : p <1.000. *=-2.5, RC={Z< -2.il], se rechaza Wo. 

9 . La duration de cierta marca de batenas es una variable aleatoria cuya 
distribution se supone normal. Se estima que su duracton media es de 500 horas 
y que el 95% del total duran entre 480.4 y 519.6 horas. Si en una muestra 
aleatoria de 9 de tales batenas se encuentra que la duration media es 495 horas. 
ies esto evidencia para concluir al nivel de signification del 5% que la duration 
media de todas esas batenas es diferente de 500 horas?. 

Rp. Ho :p =500, W,:p *500. a= 10, 96<Z< 1 96 }. z* = - I 5. No 

10. Se afirma que los fumadores adultos del pafs consumen en promedio al menos 
10 cigarrillos por dia. Para comprobar esta afirmacion, se escoge una muestra 
aleatoria de 36 fumadores adultos y se observa X t el numero de cigarrillos que 

?6 -ir 

fuman por dia, resultando: ^ X, = 324 y ^ X; - 323 1 . Utilizando a=0.01 . 

i=l i=l 

a) ^,Parecena esto indicar que el promedio del consurno es menor que 10? 

b) Encuentre la probabilidad del error del tipo II de la prueba si el valor real de 
la media es 8 cigarrillos por dia. 

Rp a) Wo p >10, W,:p<l0. zt=-2, /?C={Z<- 2.33} , se acepta Wo. b) 0=0.0475 

11 . Cierta prueba de mgreso universitario tiene una media de 200 puntos v una 
desviacion estandar de 50 puntos. Si para comprobar el valor de la media se 
utiliza la region critica WC={X <190}donde X es la media dc muestras de 
tamano 100, 
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a) iCon que probabilidad se rechaza H 0 :p =200 si es verdadera? 

b) Hallar el porcentaje de casos en que se acepta H 0 si realmente es p = 180 . 

Rp. a) a=0.0228, b) p=0.0228, 228 casos de 1 0.000. 

12 . Se afirma que el peso de los alumnos varones de la universidad tiene una media 
de 68 kg. y una desviacion estandar de 3.6 kg. Si para verificar p =68 se utiliza 
la region critica RC = {X <67 o X >69} donde X es la media de muestras 
de tamano 64, ^en que porcentaje de casos esta region critica no detecta una 
diferencia igual a 2 kg. en el promedio de los pesos y por encima de 68 kg.?. 

Rp. p=0.0132 en 132 casos de 10,000 

13 . Se cree que el tiempo promedio que utilizan los alumnos del ciclo basico para 
realizar cierta prueba de aptitud tiene distribucion normal cuya media es 15 
minutos. Para comprobar la hipotesis respecto a la media se toma una muestra 
aleatoria de 16 de tales alumnos y se encuentra un promedio de 16 minutos. 
Realice una prueba unilateral 

a) Con el nivel de significacion a =0.05, si sabe que a = 3.2 

b) Con el nivel de significacion a =0.05, si s = 3.2 se calcula de la muestra. 

c) Utilizando el metodo de la probabilidad P, si sabe que a = 3.2 



Rp H n :ix< 15 H\.\i >15. a) zt=1.25. /?C={Z> 1.645}. b) f*=1.25, gl=!5, RC= [T>\: 753 }, c) P=0 1056. 



14 . Cierta prueba de inteligencia para estudiantes preuni versitarios tiene una media 
de 100 puntos. Para verificar el valor de la media se aplico la prueba a una 
muestra aleatoria de 36 estudiantes pre uni versitarios dando una media de 90 
puntos y una desviacion estandar de 30 puntos. Si a = 0.01, ^cual es la 
probabilidad de rechazar en forma acertada que el promedio de la prueba es 100 
puntos cuando realmente es 80 puntos?. 

Rp Ho'.p = 1 00. //,:p=80 /?C={ X <88.35}. 1-p =0.9525. 

15 . Un fabricante afirma que el nuevo hilo sintetico que produce tiene una 
resistencia media a la ruptura mayor de 15 kilogramos. Para probar esta 
hipotesis se escoge una muestra de 36 de tales hilos encontrando una media y 
una desviacion estandar de resistencia a la ruptura de 16 y 3 kg. 
respectivamente. Utilizando a = 0.05 , 

a) Probar la afirmacion del fabricante comparando a con P = P[X > 16} . 

b) Hallar el porcentaje de las veces en que tal muestra nos lleva a rechazar en 
forma acertada que la resistencia media a la ruptura es igual a 15 kg. cuando 
realmente es igual a 2 kg. por encima de ello. 

Rp. a)A/ 0 :p=15, //,:*! >15./?C={ X >15.8225}, P=0. 0228, se rechaza A/ 0 , b) 1-0=0.9909 en 

9909 casos de 10,000. 
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16 . El gerente de ventas de una compama afirma que sus vendedores venden 
semanalmente en promedio $1,500. 

a) A1 nivel de signification del 5% pruebe la hipotesis del gerente versus la 
hipotesis del presidente de los vendedores que afirma que el promedio de 
las ventas semanales es mayor, si una muestra de 36 vendedores ha dado 
una media igual a $15 10 y una varianza igual a 900$ 2 en una semana. 

b) i,Con que probabilidad la prueba anterior no detecta la diferencia igual a 
20$ diarios en el promedio de ventas por dfa y por encima de lo que se 
indica en la hipotesis nula?. 

Rp. a)M>:p=b500,A/,:p>L500, RC=[ X >1508.225} se rechaza H 0 b)P=0.0091. 



17 . Los sacos de cafe que recibe un exportador deben tcner un peso promedio de 
100 kilogramos. Un inspector tomo una muestra de 50 sacos de un lote de 500 
sacos de cafe encontrando una media de 98 Kg. y una desviacion estandar de 3 
Kg.. Con a =0.02 y mediantc una prueba unilateral 

a) ^Es razonable que el exportador rechace el lote de sacos de cafe?. 

b) iC on que probabilidad esta prueba de hipotesis detecta la diferencia igual a 
2 Kg. en el peso promedio del lote y por debajo de lo que se requiere para 
exportar?. 

Rp Poblacion finita a) //n.p = 100. RC= { X <99.174}, se rechaza H u . 

b ) P\X < 99. 174/ji=98]=0.9982. 

18 . Un fabricante esta considerando la adquisicion de un nuevo equipo para enlatar 
conservas de palmito y especifica que el contenido promedio debe ser 300 
gramos por lata. Un agente de compras hace una visita a la compama donde esta 
instalado el equipo y observa que una muestra aleatoria de 10 latas de palmito 
ha dado los siguientes pesos en gramos. 



Pesos 


296 


297 


298 


299 


300 


301 


302 


# de latas 


2 


2 


2 


1 


l 


1 


1 



Y encuentra ademas que provienert de una poblacion normal. Frobar la hipotesis 
nula que la media poblacional es 300 gramos contra una alternativa bilateral. 

a) Utilizando un nivel de significacion del 5%, 

b) Por el metodo de la probabilidad P. (Utilice un paquete de computo) 

Rp. Ho : p =300, *300, error estdndar=0.653, f*=-2..45, gl=9. a) RA~{-2.262<T< 2.262}, 

se rechaza Ho, b) el MCEST da / J =P[7<-2.45]=0.0177, signif. bilateral=0.0354. 

19 . El promedio de nicotina que tiene cierta marca de cigarrillos es 10 miligramos 
por cigarrillo. El fabricante afirma que un nuevo proceso de fabricacion reducira 
el promedio de la nicotina por cigarrillo. Para comprobar esta hipotesis se toma 
una muestra aleatoria de 9 cigarrillos fabricados con el nuevo proceso y se 
encuentran las siguientes cantidades de nicotina en miligramos: 



www.FreeLibros.me 



Prueba de hipotesis 



487 



9, 9.2, 8.5, 8.7, 9, 8.8, 9.2, 9.4, 9.2 

y se encuentra ademas que provienen de una poblacion normal. ^Es razonable 
aceptar la afirmacion del fabricante? 

a) Utilice un nivel de significacion del 1%, 

b) Por el metodo de la probabilidad P (Utilice un paquete de computo) 

Rp. a) Hq.\x2. 1 60, H \ :u< 1 60. , 1-9 5 = 0.2872, ES-0.0957, r*=- 10.4, RC={7<-2.896}, se 

rechaza M b) el MCEST da P=P[7<-10.4]=0.000. 



20. Se sabe que las ventas diaiias de una compania tienen distribucidn normal con 

una desviacion estandar de S/300. El gerente de la compania afirma que en 
promedio las ventas diarias de la compania es por lo menos S/.2,277 se trata de 
probar, con a=0.004; si la afirmacion del gerente es verdadera; para esto se 
tomara una muestra aleatoria de tamano n . Hallar n y la region critica de la 
prueba sabiendo que si la verdadera media es 1800. entonces la probabilidad de 
error tipo II serfa igual a 0.017 Rp. « = 9. RC={ X < 2012} 

21. Se afirma que el ingreso promedio mensual de un sector de informales es $400. 
Disene una prueba para probar esta hipotesis con un riesgo de 5% de cometer 
error tipo I y un riesgo de 1% de cometer error tipo II cuando realmente es 
p=$460. Suponga que g=$90. 

Rp. ii = 36, K =424.675 

22. La duracion de cierto tipo de focos de luz se distribuye normalmente con una 
media de 400 horas y una desviacion estandar de 24 horas. Se esta considerando 
aumentar la duracion promedio con un nuevo proceso. Si la duracion promedio 
aumenta 15 horas, este cambio debe detectarse con probabilidad 0.9554. Si no 
hay cambio, este debe detectarse con probabilidad 0.98. Determine el numero de 
focos que deben probarse y la region critica. 

Rp. a) it = 16 b) RC = { X >408.2}. 



Una proporcion 

23. Se controla la calidad de una muestra aleatoria de 40 piezas producidas por un 
fabricante. Si se hallaron 4 piezas defectuosas, ^se deberfa inferir que el 
porcentaje de todas las piezas defectuosas es mas del 5% al nivel de 
significacion del 5 %?. 

Rp. Mi: /?-0.05. H\: /»0.05. RC-\Z> 1 .645 }, z±~ 1 -45 se acepta Ho’ 



24. Una firma va a comercializar un nuevo producto solo si hay prueba de que al 
menos el 20% de todos los consumidores lo prefieren. Para probar esa hipotesis 
se selecciona al azar 200 consumidores. Si se utiliza como region critica 
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[ X <30} donde X es el numero de consumidores en la muestra que prefieren el 
producto, calcular la probabilidad de cometer error tipo I 

Rp a = 0.03 14 con correcci6n por continuidad. 

25. Se afirma que el 20% de todos los electores estan a favor de cierto candidato. 
Para verificar esta hipotesis se escogen 400 electores al azar y si la proporcion a 
favor en la muestra; p ; esta entre 16.08% y 23.92% se acepta que la proporcion 
a favor en la poblacion es p — 20%. En caso contrario se acepta que p * 20%. 

a) ^Cual es la probabilidad de cometer error tipo I?. 

b) Calcular la probabilidad cometer error tipo II cuando p = 0.25 

Rp. a) a =0.05. b) p=0.3085 



26. Tradicionalmente el 13% de los conductores de fin de semana conducen bajo 
los efectos del alcohol. El ultimo fin de semana fueron intervcnidos 500 
conductores aleatoriamente y 80 de ellos estaban bajo los efectos del alcohol. 
^De esta muestra se puede infenr que el porcentaje poblacional ya no es 13%?. 
Utilice a = 5%. 

Rp. z k =2.. a) RA- { - 1 96<Z < 1 .96 } se rechaza Ho. p- 0. 1 3 



27. El gerente de una tienda afirma que el 80% de los clientes del ano pasado, 
regresaran este ano a realizar sus compras. Sin embargo, analizando el mercado. 
nosotros creemos que dicho gerente ha exagerado. Para probar estas hipotesis se 
toma una muestra aleatoria de 200 clientes que el ano pasado habian comprado 
en dicha tienda. Si a = 0.05 y si la verdadera proporcion de clientes que 
regresan a la tienda es 70%. Calcular p 

Rp. 0=0.0495 

28. El Director de la bolsa de trabajo de la universidad afirma que el 10% de los 
egresados de la Universidad consiguen empleo con una remuneracion mayor de 
$3,000 mensuales. Al parecer el porcentaje indicado es opumista. Para 
comprobar esta aflrmacion se debe tomar una muestra aleatoria de n egresados. 
Hallar el tamano de la muestra y la regia de decision si se desea que la 
probabilidad de cometer error tipo I sea 0.2514 y que el riesgo de tomar una 
decisidn equivocada cuando la proporcion de egresados con una remuneracion 
mayor de $3,000 sea del 5% con una probabilidad de 0.0853 

Rp.fi = 100. K = 0.08 

29. Un legislador desea probar la hipotesis que mas del 65% de sus representados 
esta a favor de cierta legislacion laboral que se esta presentando en el congreso. 
Para esto, realiza una consul ta a 400 electores seleccionados al azar. 
Considerando a = 0.05. 
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a) ^Que valor como minimo debe tener la proporcion de la muestra, para que a 
partir de ese valor, la decision sea aceptar la hipotesis del legislador ?. 

b) ^Cual es la probabilidad de tomar la decision errada de rechazar la propuesta 
del legislador cuando en realidad el 70% de los votantes acepta la legislacion 
laboral? 

Rp. a) K= 0.689, b)P[ P <0.689 / p=0.1) = P[Z< -0.48]=0.3 1 56 

30. Se asegura que el 70% de los trabajadores estan asegurados bajo el regimen 
particular de pensiones (AFP). Para probar esta afirmacion se toma una muestra 
de 80 personas que trabajan. Si menos de 52 personas de la muestra estan 
aseguradas en el rdgimen indicado, se rechaza que el 70% de la poblacion de 
trabajadores est£ asegurado en AFP. 

a) *Cual es el nivel de significacion de la prueba? 

b) ^,Se podria decir que la prueba puede detectar una diferencia de 20% por 
debajo de lo indicado en la hipotesis nula?. 

Rp. a) a=0. 1635, b) p=P[ P > 0.65 Ip = 0.50]=P[Z > 2.68]= 0.0037. La prueba detecia la 

diferencia el l-p= 99.63% de las veces 

31. De una lista de 2,000 clientes de un banco comercial se selecciono una muestra 
aleatoria para obtener opinion acerca del servicio. En la muestra se hallo que 
215 no tienen quejas del servicio, 25 tienen quejas y 10 no opinan al respecto. 
Tradicionalmente el 5% teman quejas del servicio, sin embargo se cree que 
ahora este porcentaje aumento. *Cual es la situacion actual si se quiere una 
probabilidad de 0.007 de cometer error tipo I?. 

Rp. Poblacidn fimta H 0 . p= 0.05, Hi: p> 0.05, RC~{Z> 2.455 }, z k =3.88 , se rechaza Ho. 



Varianzas 

32. Una muestra aleatoria de 16 sobres de cierto producto cuyos pesos se 
distribuyen normalmente ha dado una desviacion estandar de 0.6 gramos. 
Utilizando un nivel de significacion del 5%, ^es valido inferir que la varianza de 
los pesos de tales sobres es mayor que 0.25 gramos 2 ? 

Rp. H 0 : ct 2 =0.25, //, a 2 >0.25 ,X~x 2 05), /?C={X>25}, .t*=21 6. se acepta H 



33. Anteriormente la desviacion estdndar de los pesos de los contenidos de cierto 
envase era 0,25 onzas, se trata de averiguar si ha habido aumento de dicha 
vanabilidad , para esto se toma una muestra aleatoria de los contenidos de 20 
envases encontrandose una desviacion estandar de 0,30 onzas Al nivel de 
significacion del 5%, ^proporcionan los datos mdicios suficientes que mdique 
un aumento significativo de tal vanabilidad?. Suponer que dichos pesos estan 
normalmente distribuidos. 

Rp. c = 0.25, H x . a > 0.25. X~* ? (19), RC={X>30.14). jc*=27.36, s€ acepta Ho. 
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34. Se escoge una muestra aleatoria de 13 tiendas y se encuentra que las ventas de 
la semana de un determinado producto de consumo popular tiene una 
desviacion estandar s = $6. Se supone que las ventas del producto tienen una 
distribucion normal. A1 nivel de significacion del 5%, isc podria inferir que la 
varianza de la poblacion es menor que 40$ 2 ?. 

Rp Ho- C 2 = 40, Hi. cr< 40 ,X~x 2 02). FC={X<5.23}. a a =10.8, se acepta H { ,. 



35. Una de las maneras de medir el grado de satisfaccion de los empleados de una 
misma categoria en cuanto a la politica salarial, es a traves de las desviaciones 
estandar de sus salarios. La fabrica A afirma ser mas homogenea en la politica 
salarial que la fabrica B. Para verificar esa afirmacion, se escoge una muestra 
aleatoria de 10 empleados no especializados de A, y 9 de B, obteniendo las 
dispersiones i^=10, de salario minimo. Suponiendo poblaciones 

normales y con a=0.01, ^cual serfa su conclusion? 

Rp. H 0 : (ai) 2 =(o 2 ) 2 , H t : (cji) 2 <(ct 2 ) 2 , F~F( 9,8), FC={F<0.183}J A ~0.44, se acepta H 0 . 



36. Los tiempos en minutos para realizar cierta tarea observados en 10 hombres y 
10 mujeres fueron: 

Hombres: 50, 45, 49, 50, 38, 58, 53, 47, 48, 55 
Mujeres: 55, 56, 57, 56, 58, 53, 54. 59, 60, 57 

Suponiendo poblaciones normales, ^se podria concluir que las varianzas 
poblacionales son diferentes?, 

a) Utilizando el nivel de significacion del 5% 

b) Utilizando la probabilidad P 

Rp. H 0 : (g,) 2 =(ct 2 ) 2 , H t : (en ) 2 *(g 2 ) 2 , F~F(9,9),/*-6.496, a) /?0{F<0.248 o F>4.03 }, se 
rechaza // 0 , b) F=F[F>6.496]=0.0057, significaci6n bilateral 0.01 14. se rechaza H ih 

Diferencia de dos medias 

37. Para comparar la aptitud de dos poblaciones de estudiantes preuni versitarios se 
toman dos muestras aleatorias respectivas dc tamanos 20 y 25, dando las medias 
respectivas de 200 y 205 puntos. Suponga que las dos poblaciones son normales 
con a, = 8, y a 2 =7. Al nivel de significacion del 1%, ^se podria concluir 

que las medias de las dos poblaciones son distintas? 

Rp Zk=- 2.2, RC ={Z< -2.515 o Z> 2.575 } se acepta //« 

38. Un inversionista esta por decidir entre dos provincias para abrir un centro 
comercial. Para esto debe probar la hipotesis de que hay diferencia en el 
promedio de ingresos familiares de las dos provincias. Si una muestra de 300 
hogares de la provincia 1 da — $400 y s } = $90 y otra muestra de 400 
hogares de la provincia 2 da x 2 = $420 y s 2 =$120. iSe puede inferir que las 
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dos medias poblacionales son diferentes?, si es asi, <,en cual de las provincias 
deberia abrir la sucursal?. Utilice a =0.05 

Rp. z*=-2.52, R.C={Z<- 1.96 o Z> 1.96), adem£sui<p 2 

39 . Se quiere determinar la diferencia entre los promedios de tiempos (en minutos) 
que utilizan los hombres y las mujeres para realizar determinada tarea. Con este 
fin se escogen 16 hombres y 16 mujeres al azar resultando los tiempos 
promedios respectivos 40 y 35 minutos, y desviaciones estandar respectivos 9 y 
8 minutos. Suponga que las poblaciones de ambos tiempos son independientes y 
que se distribuyen normalmente con varianzas iguales. Al nivel de significacion 
del 1% ^es el tiempo promedio de hombres mayor al tiempo promedio de 
mujeres?. 

Rp. gk=30, error estdndar=3 .01, 1 .66, RC-{T>2A51} % No, pi=p 2 



40. Una compama debe decidir cual de dos tipos de componente electronica A o B 
va a adquirir. Hace una prueba de 5 componentes escogidos al azar para cada 
marc a, resultando I, = 8000 y f, = 2500 horas para A y x 2 = 7000 y s 2 = 800 
horas para B. Suponga poblaciones normales con varianzas diferentes. Pruebe la 
hipotesis nula que los rendimientos medios son iguales contra la alternativa de 
que A nnde mas que B. Use a = 0.05. 

Rp. gl=5. error est£ndar=l 173.88, r k =0. 85, /?C={ 7^2.015}, p,=u 2 



41. Se afirma que una nueva dieta reduce el peso de una persona en 5 kilogramos 
promedio en un periodo de un mes. Se registran los pesos de 12 mujeres que 
siguieron esta dieta antes y despues del periodo resultando x { = 62 y x 2 = 58 

kilogramos y una desviacion estandar de las diferencias de pesos s d =5kg. 
Utilizando un nivel de significacion del 5%, Verifique la afirmacion contra la 
alternativa 

a) La diferencia de peso es diferente de 5kg. 

b) La diferencia de peso es mayor de 5kg. 

Suponga que la diferencia de los pesos tiene distribucion normal. 

Rp. d =4, s d = 5, error estandar= 1,44, gl=l 1. r K =2.77, a) RA~{ -2.201 <T<2. 201 }. bj 
/?C={7V 1.796}, se rechaza medias iguales en ambos casos 

42. Un agente de compras de una compama se vio confrontado con dos marcas de 
computadoras para su adquisicion. Se le permitio probar ambas marcas 
asignando una misma tarea a 50 maquinas de cada marca, resultando las medias 
respectivas 55 y 50 minutos. Suponga las dos poblaciones tienen varianza 
homogenea igual a 100. Para a =0.05 

a) ^Excede el tiempo promedio de la marca 1 al de la marca 2 en al menos 9 
minutos?. 
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b) Hallar la potencia de la prueba cuando la diferencia real entre promedios de 
tiempo de marca 1 menos marca 2 sea 3 minutos. 

c) iQue tan grande debe ser la muestra si la potencia de la prueba es 0.95, 
cuando la diferencia real entre promedios de tiempo marca 1 menos marca 
2 es 3 minutos 

Rp. a) //o:pi-p2^9, //i:pi-|i2<9, E.S=2, z*=- 2, RC={ Z<- 1.645} se rechaza // 0 .. 

b) 1 -0=0.9 1 3 1 , c) n= 1 05 



Utilizando un paquete de computo (por ejemplo MCEST) resolver: 

43. Para comparar los promedios de los tiempos en minutos que emplean dos 
maquinas 1 y 2 en producir un tipo de objeto, se registra el tiempo de 9 y 8 
objetos al azar producidos por las maquinas 1 y 2 respectivamente dando los 
siguientes resultados: 

Maquina 1: 12, 28, 10, 25, 24, 19, 22, 33, 17. 

Maquina 2: 16, 20, 16, 20, 16, 17, 15, 21. 

Al nivel de significacion del 5%, ^confirman estos datos que los tiempos 
promedios de las dos maquinas son diferentes?. Suponga que los tiempos en 
ambos casos se distribuyen normalmente 

Rp. F=10.186, gl:8,7, sigf.bilat=0.007, se acepta (CTi) 2 *(ct 2 ) 2 , h = 1.337, g.l.= I0, ES-2.608, 

sigfbilat=0.209, se acepta pi=U 2 . 



44. Una compania de transporte terrestre de pasajeros esta por decidir si comprar 
una marca A o una marca B de llantas para su flota de omnibuses. Se prueban 
9 llantas escogidas al azar de cada una de las marcas resultando los siguientes 
rendimientos en kilometros: 

Marca A: 32000, 30000, 33000, 31000, 32000, 35000, 34000, 35000, 31000 
Marca B: 35000, 37000, 36000, 38000, 37000, 39000, 32000, 33000, 40000 

Supomendo poblaciones normales y con a =0.01 

a) podrfa concluir que las varianzas son iguales? 

b) ^Se puede concluir que las dos marcas rinden igual?. Si no es asi, c que 
marca rinde mas?, 

Rp. a) F=2.136, RA={0A3<F<1 .50). sigf.bil=0.3037 se acepta (ai) 2 =(a 2 ) 2 , b) f*=— 3.54, g.i.= 16. 

ES= 1068.632, i64={-2.92l<7<2.921 }. sigf.bi 1=0.003, se rechaza p,=p 2 . 



45.. Una empresa envasa en frascos de 300 gramos uno de sus productos que tiene 
dos componentes Ay B, en iguales cantidades promedio. Una muestra aleatoria 
de 10 frascos ha dado los siguientes porcentajes de la componente A 

48%, 52%, 49%, 55%, 62%, 51%, 53%, 54%, 55%, 56% 

Suponiendo que los contemdos A y B tienen distnbucion normal y a =0.05. 
a) Determine si las varianzas de los contenidos de ambas componentes son 
iguales. 
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b) ;,Son diferentcs los promedios de los contenidos de ambas componentes?. 

Rp. a) A: 144. 156, 147. 165, 186, 153, 159, 162, 165. 168, B 156, 144, 153, 135. 114. 147 
141. 138, 135. 132, F- 1, gl:9,9, sigf.bil-1.00 se acepta (Oi) 2 =(ci 2 f. b) f 4 =3.934, g.l=18, 

ES-5 34. sigf.bi 1=0.001. se rechaza 



46. Para un bien de consumo popular del fabricante A, una muestra de 10 tiendas 
ha dado las siguientes ventas (en dolares): 

32000, 30000, 33000, 31000, 32000, 35000, 34000, 35000, 31000, 33000 

Para el mismo bien de consumo popular del fabricante B, una muestra de 1 1 
tiendas ha dado las siguientes ventas: 

35000, 32000, 36000, 38000, 37000, 39000, 38000, 40000, 42000, 45000, 44000 

Suponiendo poblaciones normales y a = 0.05 

a) ^Se podrfa concluir que las varianzas son iguales? 

b) ^Se podrfa concluir que son iguales los promedios de ventas de los dos 
productos?. Si no es asf, ^que producto se vende mas?. 

Rp. a) F=5.12, gl:10,9, sigf.bi 1^=0.022 se rechaza (CT|) 2 =(C 2 ) 2 , b) f*=~4.758. g.l=14. 
ES= 1287.875, sigf. bil=0.003, sigf.unil==0.0015. se acepta B vende mas. 



47. Una compahfa debe decidir entre dos tipos de fluorescentes para todos los 
ambientes de su local. Por cuestiones de precio la compahfa desearia comprar 
los fluorescentes de marca A, a mcnos que haya evidencia que la marca B tenga 
mayor duracion que la marca A. Se prueban 8 fluorescentes de cada marca y 
se obtienen las siguientes duraciones en horas 

Marca A: 1500, 1700, 1600, 1800, 1700, 1900, 1200, 1300 
Marca B: 1200, 1000, 1300, 1100, 1200, 1500, 1400, 1500 

Suponiendo normalidad y utilizando un nivel de significacion del 5%, 

a) ^Se podrfa concluir que las varianzas poblacionales son iguales? 

b) i,Que marca debe comprar la empresa?. 

Rp. 1.739, gl:7,7. sigf.biI-0.482 se acepta (ct,) 2 =(ct 3 ) 2 , b) fc=2.9l5. g.l=14, ES=107 217, 
sigf.bil^O.l 1 , sigf.unil=0.005, se acepta pi>p 2 adquinr marca A. 



48. Un encargado de compras de una compahfa tiene que escoger entre dos tipos de 
maquinas A y B, para hacer cierta operacion. Se le permitio probar ambas 
maquinas durante un periodo de prueba para lo cual se asignan 10 tareas 
similares a cada una de las dos maquinas y se obtienen los siguientes tiempos 
en segundos: 

Maquina A: 55, 56, 57, 56, 58, 53, 54, 59, 60, 57 
Maquina B: 50, 45, 49, 50, 38, 58. 53, 47, 48, 55 

Suponiendo normalidad y utilizando un nivel de significacion del 5%, 
a ) podrfa concluir que las varianzas poblacionales son iguales? 
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b) ^Que tipo de maquina deberfa comprar la empresa?. 

Rp. F=6.946, gl:9.9, sigf.bil=0.01 1 se acepta (CTi) 2 *(ct 2 ) 2 . b) /*=3.83, g.l=12. ES=1 .88, 
sigf.bil=0.002, sigf.unil=0.001, se acepta )ii>p 2 adquirir maquina B 

49. Una compania de transporte interprovincial debe decidir si compra la marca A o 
la marca B de neumaticos para su flota de omnibus. Para estimar la diferencia 
entre las dos marcas asigna un neumatico de cada marca a las ruedas delanteras 
de 12 omnibus y se registran en miles de kilometros las siguientes distancias: 



Omnibus 


1 


2 


3 


4 


5 


6 


7 


8 


9 


10 


11 


12 


Marca A 


50 


47 


38 


44 


35 


36 


44 


48 


46 


48 


49 


51 


Marca B 


45 


43 


30 


39 


35 


31 


42 


44 


37 


46 


48 


52 



Utilizando un nivel de significacion del 5%, ^se puede concluir que los 
promedios de rendimiento son iguales en ambas marcas con una prueba 
bilateral?. Suponga que las diferencias de las distancias se distribuyen en forma 
normal. 

Rp. d =3.67, s d = 3.025. ES=0.873,gl-:ll,rK=4.!99,^={-2.201<7’<2.201} 

Sigf.bil=0.001, se rechaza pi=u:. 



Diferencia de dos proporciones 

50 . Una empresa de estudios de mercado quierc saber si un producto promocionado 
a nivel nacional lo adquieren los hombres en mayor porcentaje que las mujeres. 
Si en dos muestras aleatorias independientes de 900 hombres y 800 mujeres se 
encontro que 270 hombres y 200 mujeres adquieren el producto, ^cual es su 
decision al nivel a = 0.004?. 

Rp. Ho'Pi=pi. H\.p\>p?* 7k=2.3. /?C-{ Z>2.65} lo adquieren en igual canlidad. 

51 . Verificar la afirmacion de que la diferencia /;, - p 2 es mcnor que 5% donde p\ 
y p 2 son las proporciones de objetos defectuosos de dos fabricantes A y B. si dos 
muestras aleatorias independientes de 200 objetos de cada fabricante dan 20 y 
12 objetos defectuosos rcspectivamente para Ay B. Use el nivel de 
significacion: 5 %. 

Rp. Hn.p 1-/72=0.05, H t :p\-p2<0.05. Zk~~ 0.37. RC-{Z<- 1.645}, se acepta Ho . 

52 . En una muestra de 500 hogares de Trujillo se encuentra que 50 de el los estan 
viendo via satelite un programa especial de television. En Tarapoto, 28 hogares 
de una muestra aleatoria de 400 se encucntran viendo el mismo programa 
especial. ^Puede rechazarse la suposicion del patrocinador de que el porcentaje 
de hogares que estan observando el programa especial es el mismo en las dos 
ciudades?. Util ice una prueba bilateral y a =0.05. 

Rp. Ho:pi=pi. H\:pv*p?. Zk=l-59. &4={-I 96<Z<1.96) se acepta f/ n . 
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53 . En un estudio de mercado para deierminar el rating de los programas de TV del 
mediodfa una muestra aleatoria de 400 hogares de cierta comunidad revela que 
80 estan sintonizando el programs de TV B, 120 sintonizan el programs G y el 
resto sintonizan otra cosa. ^Es la proportion global de televidentes que 
sintonizan el programa B igual al que sintonizan G?. Utilice a= 0.01 y una 
prueba bilateral 

Rp. HqP\=P 2 , Hup&pz, z*=-3.27, &4={-2.575<Z<2.575} se rechaza Hu 

54 . Una agencia de publicidad realizo un estudio para comparar la efectividad de un 
anuncio en la radio en dos distritos. Despues de difundir dicho aviso, se realizo 
una encuesta telefonica con 600 personas seleccionadas al azar, que viven en 
cada uno de los distritos resultando las proporciones: 20% y 18% 
respectivamente. Verificar, al nivel de signification del 5%, si son iguales las 
proporciones de personas que escucharon dicho aviso en los dos distritos 
mediante una prueba unilateral. 

Rp- Zk=0.88, RC ~{Z> 1 .645 } se acepta Ho. 
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TABLA DE LA DISTRIBUTION NORMAL ESTANDAR 



La tabla da areas 1 - a y valores 
c = Z,_ u , donde, P[Z < c] = 1 - a . 
y donde Z tiene distribucion normal N( 0, 1 ). 




z 


Segundo decimal de Z 


.00 


.01 


.02 


.03 


.04 


.05 


.06 


.07 


.08 


.09 


0.0 


.5000 


.5040 


.5080 


.5120 


.5160 


.5199 


.5239 


.5279 


.5319 


.5359 


0.1 


.5398 


.5438 


.5478 


.5517 


.5557 


.5596 


.5636 


.5675 


. 5714 


.5753 


0.2 


.5793 


.5832 


.5871 


.5910 


.5948 


.5987 


.6026 


.6064 


.6103 


.6141 


0.3 


.6179 


6217 


.6255 


6293 


6331 


.6368 


6406 


6443 


6480 


6517 


0.4 


.6554 


.6591 


.6628 


.6664 


.6700 


. 6736 


.6772 


.6808 


. 6844 


. 6879 


0.5 


.6915 


.6950 


.6985 


.7019 


.7054 


.7088 


.7123 


.7157 


.7190 


.7224 


0.6 


7257 


.7291 


.7324 


.7357 


.7389 


.7422 


.7454 


.7486 


.7517 


.7549 


0.7 


.7580 


.7611 


.7642 


.7673 


.7704 


.7734 


.7764 


.7794 


.7823 


.7852 


0.8 


.7881 


.7910 


.7939 


.7967 


.7995 


.8023 


.8051 


. 8078 


. 8106 


.8133 


0 9 


.8159 


8186 


8212 


.8238 


.8264 


.8289 


8315 


.8340 


.8365 


.8389 


1.0 


. 8413 


.8438 


.8461 


.8485 


.8508 


.8531 


.8554 


.8577 


.8599 


. 8621 


1.1 


.8643 


.8665 


.8686 


. 8708 


.8729 


.8749 


.8770 


.8790 


.8810 


. 8830 


1.2 


.8849 


.8869 


. 8888 


.8907 


.8925 


.8944 


.8962 


.8980 


. 8997 


.9015 


1.3 


.9032 


.9049 


.9066 


.9082 


.9099 


.9115 


.9131 


.9147 


.9162 


.9177 


1.4 


.9192 


.9207 


.9222 


.9236 


.9251 


.9265 


.9279 


.9292 


.9306 


.9319 


1.5 


.9332 


.9345 


.9357 


.9370 


.9382 


.9394 


.9406 


.9418 


.9429 


. 9441 


1.6 


.9452 


.9463 


.9474 


.9484 


.9495 


.9505 


.9515 


.9525 


.9535 


.9545 


1.7 


.9554 


.9564 


.9573 


.9582 


.9591 


.9599 


.9608 


.9616 


.9625 


.9633 


1.8 


.9641 


.9649 


.9656 


.9664 


.9671 


.9678 


.9686 


.9693 


.9699 


.9706 


1.9 


.9713 


.9719 


.9726 


.9732 


.9738 


.9744 


.9750 


.9756 


.9761 


.9767 


2 . 0 


9772 


9778 


.9783 


9788 


.9793 


.9798 


.9803 


.9808 


.9812 


.9817 


2.1 


.9821 


.9826 


.9830 


.9834 


.9838 


.9842 


.9846 


.9850 


.9854 


.9857 


2.2 


.9861 


.9864 


. 9868 


.9871 


.9875 


.9878 


.9881 


.9884 


.9887 


.9890 


2.3 


.9893 


. 9896 


.9898 


.9901 


.9904 


.9906 


.9909 


.9911 


.9913 


.9916 


2.4 


.9918 


. 9920 


.9922 


.9925 


. 9927 


.9929 


.9931 


.9932 


.9934 


.9936 


2.5 


.9938 


.9940 


.9941 


.9943 


.9945 


.9946 


.9948 


.9949 


.9951 


.9952 


2.6 


.9953 


.9955 


.9956 


.9957 


.9959 


.9960 


. 9961 


- 9962 


9963 


9964 


2.7 


.9965 


.9966 


.9967 


.9968 


. 9969 


.9970 


.9971 


.9972 


.9973 


.9974 


2.8 


.9974 


.9975 


.9976 


.9977 


.9977 


.9978 


.9979 


.9979 


.9980 


.9981 


2.9 


. 9981 


.9982 


.9982 


.9983 


.9984 


.9984 


.9985 


.9985 


.9986 


.9986 


3 . 0 


.9987 


.9987 


.9987 


.9988 


.9988 


.9989 


.9989 


.9989 


.9990 


.9990 


3 . 1 


. 9990 


.9991 


.9991 


.9991 


.9992 


.9992 


.9992 


.9992 


.9993 


.9993 


3.2 


.9993 


.9993 


.9994 


. 9994 


.9994 


.9994 


.9994 


.9995 


.9995 


.9995 


3.3 


.9995 


.9995 


.9995 


.9996 


.9996 


.9996 


.9996 


.9996 


.9996 


. 9997 


3.4 


.9997 


.9997 


.9997 


.9997 


.9997 


.9997 


.9997 


.9997 


. 9997 


.9998 


3.5 


.9998 


.9998 


.9998 


.9998 


.9998 


.9998 


.9998 


.9998 


.9998 


.9998 


3.6 


.9998 


.9999 


.9999 


.9999 


.9999 


.9999 


.9999 


.9999 


.9999 


.9999 


3.8 


.9999 


.9999 


.9999 


.9999 


.9999 


.9999 


.9999 


1.000 


1.000 


1.000 


4.0 


1.000 


1.000 


1.000 


1.000 


1.000 


1.000 


1.000 


1.000 


1.000 


1.000 
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APANDICE B 



TABLA DE LA DISTRIBUCION f-Student 



La tabla da &reas 1 - a y valores c - t Ui± r , 
donde, P[T < cj = 1 - o , y donde T tiene 
distribution /-Student con r grados de 
libertad. 



r 








1 - 


a 








0.75 


0.80 


0.85 


0.90 


0.95 


0.975 


0 99 


0.995 


1 


1.000 


1.376 


1.963 


3.078 


6.314 


12.706 


31 821 


63 . 657 


2 


0.816 


1.061 


1.386 


1.886 


2.920 


4.303 


6 965 


* 9.925 


3 


0.765 


0.978 


1.250 


1.638 


2.353 


3.182 


4 541 


5.841 


4 


0.741 


0.941 


1.190 


1.533 


2.132 


2.776 


3.747 


4.604 


5 


0.727 


0.920 


1.156 


1.476 


2.015 


2.571 


3.365 


4.032 


6 


0.718 


0.906 


1.134 


1.440 


1.943 


2.447 


3.143 


3.707 


7 


0.711 


0.896 


1.119 


1.415 


1.895 


2.365 


2 998 


3.499 


8 


0.706 


0.889 


1.108 


1.397 


1.860 


2.306 


2.896 


3.355 


9 


0.703 


0.883 


1.100 


1.383 


1.833 


2.262 


2.821 


3.250 


10 


0.700 


0.879 


1.093 


1.372 


1.812 


2.228 


2.764 


3.169 


11 


0.697 


0.876 


1.088 


1.363 


1.796 


2.201 


2.718 


3.106 


12 


0.695 


0.873 


1.083 


1.356 


1.782 


2.179 


2.681 


3.055 


13 


0.694 


0.870 


1.079 


1.350 


1.771 


2.160 


2.650 


3.012 


14 


0.692 


0.868 


1.076 


1.345 


1.761 


2.145 


2.624 


2 977 


15 


0.691 


0.866 


1.074 


1.341 


1.753 


2.131 


2.602 


2.947 


16 


0.690 


0.865 


1.071 


1.337 


1.746 


2.120 


2.583 


2.921 


17 


0.689 


0.863 


1.069 


1.333 


1.740 


2.110 


2.567 


2 898 


18 


0.688 


0.862 


1.067 


1.330 


1.734 


2.101 


2.552 


2.878 


19 


0.688 


0.861 


1.066 


1.328 


1.729 


2.093 


2.539 


2.861 


20 


0.687 


0.860 


1.064 


1.325 


1.725 


2.086 


2.528 


2.845 


21 


0.686 


0.859 


1.063 


1.323 


1.721 


2.080 


2.518 


2 831 


22 


0.686 


0.858 


1.061 


1.321 


1.717 


2.074 


2.508 


2 819 


23 


0.685 


0.858 


1.060 


1.319 


1.714 


2.069 


2.500 


2.807 


24 


0.685 


0.857 


1.059 


1.318 


1.711 


2.064 


2.492 


2.797 


25 


0.684 


0.856 


1.058 


1.316 


1.708 


2.060 


2.485 


2 . 787 


26 


0.684 


0.856 


1.058 


1.315 


1.706 


2.056 


2.479 


2.779 


27 


0.684 


0.855 


1.057 


1.314 


1.703 


2.052 


2.473 


2.771 


28 


0.683 


0.855 


1.056 


1.313 


1.701 


2.048 


2.467 


2.763 


29 


0.683 


0.854 


1.055 


1.311 


1.699 


2.045 


2.462 


2.756 


30 


0.683 


0.854 


1.055 


1.310 


1.697 


2.042 


2.457 


2.750 


40 


0.681 


0.851 


1.050 


1.303 


1.684 


2.021 


2.423 


2.704 


60 


0.679 


0.848 


1.046 


1.296 


1.671 


2.000 


2.390 


2.660 


120 


0.677 


0.845 


1.041 


1.289 


1.658 


1.980 


2.358 


2.617 


OO 


0.674 


0.842 


1.036 


1.282 


1.645 


1.960 


2.326 


2.576 
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APANDICE C 



TABLA DE LA DISTRIBUCION CHI-CUADRADO 



La tabla da areas 1 - a y valores c = X?- a .r 
tales que P[X <, c] = 1 - a, donde X tiene 
distribution x 2 con r grados de libertad. 






















1 


- a 




















r 


0.005 


0.010 


0.025 


0.050 


0 . 


100 


0.900 


0.950 


0.975 


0.990 


0.995 


1 


0.0000 


0.0002 


0.0010 


0.0039 


0.0158 


2. 


.71 


3. 


.84 


5, 


.02 


6. 


64 


7. 


,88 


2 


0.0100 


0.0201 


0.0506 


0.103 


0.211 


4. 


61 


5. 


.99 


7. 


38 


9. 


21 


10. 


.60 


3 


0.072 


0.115 


0.216 


0.352 


0.584 


6. 


.25 


7. 


.82 


9. 


.35 


.11- 


35 


12, 


84 


4 


0.207 


0.297 


0.484 


0.711 


1.064 


7. 


,78 


9. 


.49 


11 


14 


13 


28 


14. 


.86 


5 


0.412 


0.554 


0.831 


1.145 


1 


.61 


9. 


.24 


11. 


.07 


12. 


.83 


15. 


09 


16. 


.75 


6 


0.676 


0.872 


1.24 


1 


64 


2 


.20 


10. 


65 


12. 


.59 


14. 


.45 


16. 


81 


18. 


.55 


7 


0.989 


1 


.24 


1.69 


2 


17 


2 


.83 


12. 


.02 


14 


.07 


16. 


.01 


18. 


,48 


20. 


.28 


8 


1 


34 


1 


.65 


2.18 


2 


73 


3 


.49 


13. 


.36 


15 


.51 


17. 


.54 


20. 


,09 


21. 


.96 


9 


1 


.74 


2 


.09 


2.70 


3. 


.33 


4. 


.17 


14, 


.68 


16 


.92 


19, 


.02 


21. 


67 


23, 


.59 


10 


2 


. 16 


2 


.56 


3.25 


3. 


.94 


4 


.87 


15. 


.99 


18, 


.31 


20. 


.48 


23. 


,21 


25. 


.19 


11 


2 


.60 


3 


.05 


3.82 


4. 


.58 


5 


.58 


17. 


28 


19, 


.68 


21. 


.92 


24. 


73 


26. 


.76 


12 


3 


.07 


3 


.57 


4.40 


5 


>23 


6 


.30 


18. 


55 


21. 


.03 


23. 


.34 


26. 


22 


28. 


30 


13 


3 


.57 


4 


.11 


5.01 


5 


.89 


7 


.04 


19. 


.81 


22. 


.36 


24. 


.74 


27. 


69 


29. 


82 


14 


4 


.07 


4 


.66 


5.63 


6 


.57 


7 


.79 


21. 


.06 


23 , 


.69 


26. 


.12 


29. 


14 


31. 


.32 


15 


4 


.60 


5 


.23 


6.26 


7 


.26 


8 


.55 


22. 


.31 


25. 


.00 


27. 


.49 


30. 


58 


32. 


.80 


16 


5 


. 14 


5 


. 81 


6.91 


7 


.96 


9 


.31 


23. 


54 


26. 


.30 


28. 


.85 


32, 


.00 


34. 


.27 


17 


5 


.70 


6 


.41 


7.56 


8 


.67 


10 


.09 


24 


.77 


27, 


.59 


30. 


. 19 


33. 


41 


35. 


.72 


18 


6 


.27 


7 


.01 


8.23 


9 


.39 


10 


.87 


25. 


.99 


28 


.87 


31. 


.53 


34. 


81 


37 


16 


19 


6 


.84 


7 


.63 


8.91 


10 


.12 


11 


.65 


27. 


.20 


30. 


.14 


32. 


.85 


36. 


.19 


38. 


.58 


20 


7 


.43 


8 


.26 


9.59 


10 


. 85 


12 


.44 


28. 


.41 


31. 


.41 


34. 


.17 


37. 


,57 


40. 


.00 


21 


8 


.03 


8 


.90 


10.28 


11 


.59 


13 


.24 


29. 


.62 


32. 


.67 


35. 


.48 


38. 


93 


41. 


.40 


22 


8 


. 64 


9 


.54 


10.98 


12 


.34 


14 


.04 


30. 


.81 


33 


.92 


36. 


.78 


40. 


,29 


42 . 


.80 


23 


9 


.26 


10 


.20 


11.69 


13 


.09 


14 


.85 


32. 


.01 


35. 


.17 


38. 


.08 


41. 


.64 


44 . 


. 18 


24 


9 


.89 


10 


.86 


12.40 


13 


.85 


15 


.66 


33. 


. 20 


36. 


.42 


39. 


.36 


42. 


,98 


45. 


.56 


25 


10 


.52 


11 


.52 


13.12 


14 


. 61 


16 


.47 


34 . 


.38 


37. 


.65 


40 


.65 


44 . 


.31 


46. 


.93 


26 


11 


.16 


12 


.20 


13.84 


15 


.38 


17 


.29 


35. 


.56 


38 


. 89 


41 


.92 


45 


64 


48 


.29 


27 


11 


.81 


12 


.88 


14.57 


16 


.15 


18 


. 11 


36 


.74 


40 


. 11 


43 


.19 


46. 


.96 


49. 


.64 


28 


12 


.46 


13 


.57 


15.31 


16 


.93 


18 


.94 


37 


.92 


41 


.34 


44 


.46 


48 , 


.28 


50. 


.99 


29 


13 


.12 


14 


.26 


16.05 


17 


.71 


19 


.77 


39. 


.09 


42 


.56 


45 


.72 


49 


. 59 


52 


.34 


30 


13 


.79 


14 


.95 


16.79 


18 


.49 


20 


. 60 


40. 


.26 


43 


.77 


46. 


.98 


50. 


. 89 


53. 


.67 


40 


20 


.71 


22 


.16 


24.43 


26 


.51 


29 


.05 


51. 


.81 


55. 


.76 


59 


.34 


63. 


. 69 


66 


.77 


50 


27 


.99 


29 


.71 


32.36 


34 


.76 


37 


. 69 


63 


. 17 


67, 


.50 


71 


.42 


76. 


15 


79 


.49 


60 


35 


.53 


37 


48 


40.48 


43 


.19 


46 


.46 


74 


.40 


79 


.08 


83. 


.30 


88. 


,38 


91 


.95 


70 


43 


.28 


45 


.44 


48.76 


51 


.74 


55 


.33 


85 


.53 


90 


.53 


95 


.02 


100.4 


104.2 


80 


51 


.17 


53 


.54 


57.15 


60 


.39 


64 


.28 


96. 


.58 


101.9 


106.6 


112.3 


116.3 


90 


59 


.20 


61 


.75 


65.65 


69 


.13 


73 


.29 


107.6 


113.1 


118.1 


124.1 


128.3 


100 


67 


.33 


70 


.06 


74.22 


77 


.93 


82 


.36 


118.5 


124.3 


129.6 


135.8 


140.2 
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APANDICE D 



TABLA DE LA DISTRIBUCION DE PROBABILIDADES F 



La labia da Araas 1 - a y valores tales que 

P[F < c\ - 1 - a . Donde r\ y r 2 son los grados de iibertad, 
y donde F a ^ r> = 1 ^ . 




10 



12 



15 



120 









. 95 


1 


161 


200 


216 


225 


230 


234 


237 


239 


241 


242 


244 


246 


248 


253 


.975 




648 


800 


864 


900 


922 


937 


948 


957 


963 


969 


977 


985 


993 


1014 


.95 


2 


18 5 


19 


.0 


19.2 


19 


.2 


19 


3 


19 


.3 


19 


.4 


19 


.4 


19 


.4 


19 


4 


19 


4 


19 


.4 


19 


.4 


19 


.5 


.975 




38.5 


39 


.0 


39.2 


39 


.2 


39 


.3 


39 


.3 


39 


.4 


39 


4 


39 


. 4 


39 


. 4 


39 


.4 


39 


.4 


39 


. 4 


39 


.5 


. 99 




98.5 


99 


.0 


99.2 


99 


.2 


99 


.3 


99 


.3 


99 


.4 


99 


. 4 


99 


. 4 


99 


.4 


99 


.4 


99 


. 4 


99 


. 4 


99 


.5 


.995 




199 


199 


199 


199 


199 


199 


199 


199 


199 


199 


199 


199 


199 


199 


.95 


3 


10.1 


9 . 


55 


9.28 


9 . 


12 


9 . 


01 


8 . 


94 


8 . 


89 


8 . 


85 


8 . 


81 


8 . 


79 


8 . 


74 


8 . 


70 


8 . 


66 


8 . 


55 


. 975 




17.4 


16 


.0 


15.4 


15 


. 1 


14 


.9 


14 


.7 


14 


.6 


14 


. 5 


14 


.5 


14 


.4 


14 


.3 


14 


.3 


14 


.2 


13 


.9 


.99 




34.1 


30 


.8 


29. 5 


28 


.7 


28 


.2 


27 


.9 


27 


.7 


27 


.5 


27 


.3 


27 


. 2 


27 


. 1 


26 


.9 


26 


.7 


26 


.2 


.995 




55.6 


49 


.8 


47.5 


46 


.2 


45 


.4 


44 


.8 


44 


.4 


44 


. 1 


43 


.9 


43 


7 


43 


. 4 


43 


. 1 


42 


.8 


42 


.0 


.95 


4 


6.71 


6 . 


94 


6.59 


6 . 


39 


6 . 


26 


6 . 


16 


6 . 


09 


6 . 


04 


6 . 


00 


5 . 


96 


5 . 


91 


5 . 


86 


5 . 


80 


5 . 


66 


.975 




12.2 


10 


.6 


9.98 


9 . 


60 


9 . 


36 


9 . 


20 


9 . 


07 


8 . 


98 


8 . 


90 


8 . 


84 


8 . 


75 


8 . 


66 


8 . 


56 


8 . 


31 


. 99 




21.2 


18 


.0 


16.7 


16 


0 


15 


.5 


15 


.2 


15 


.0 


14 


.8 


14 


7 


14 


.. 5 


14 


.4 


14 


2 


14 


. 0 


13 


. 6 


. 995 




31.3 


26 


.9 


24.3 


23 


2 


22 


. 5 


22 


.0 


21 


.6 


21 


.4 


21 


. 1 


21 


.0 


20 


.7 


20 


.4 


20 


.2 


19 


.5 


.95 


5 


6.61 


5 . 


79 


5.41 


5 . 


19 


5 . 


05 


4 . 


95 


4 . 


88 


4 . 


82 


4 . 


77 


4 . 


74 


4 . 


68 


4 . 


62 


4 . 


56 


4 . 


40 


.975 




10.0 


8 . 


43 


7.76 


7 . 


39 


7 . 


15 


6 . 


98 


6 . 


85 


6 . 


76 


6 . 


68 


6 . 


62 


6 . 


52 


6 . 


43 


6 . 


33 


6 . 


07 


. 99 




16.3 


13 


.3 


12.1 


11 


.4 


11 


.0 


10 


.7 


10 


.5 


10 


3 


10 


.2 


10 


. 1 


9 . 


89 


9 . 


72 


9 . 


55 


9 . 


11 


. 995 




22.8 


18 


.3 


16.5 


15 


. 6 


14 


.9 


14 


.5 


14 


.2 


14 


0 


13 


. 8 


13 


6 


13 


4 


13 


1 


12 


.9 


12 


.3 


. 95 


6 


5.99 


5 . 


14 


4.76 


4 


53 


4 . 


39 


4 


28 


4 . 


21 


4 . 


15 


4 . 


10 


4 . 


06 


4 . 


00 


3 . 


94 


3 . 


87 


3 . 


70 


. 975 




8.81 


7 . 


26 


6.60 


6 . 


23 


5 . 


99 


5 . 


82 


5 . 


70 


5 . 


60 


5 . 


52 


5 . 


46 


5 . 


37 


5 . 


27 


5 . 


17 


4 . 


90 


. 99 




13.7 


10 


.9 


9.78 


9 . 


15 


8 . 


75 


8 . 


47 


8 . 


26 


8 . 


10 


7 


98 


7 . 


87 


7 . 


72 


7 . 


56 


7 . 


40 


6 . 


97 


995 




18.6 


14 


.5 


12.9 


12 


. 0 


11 


.5 


11 


. 1 


10 


. 8 


10 


.6 


10 


4 


10 


.2 


10 


, 0 


9 . 


81 


9 . 


59 


9 . 


00 


. 95 


7 


5.59 


4 . 


74 


4.35 


4 . 


12 


3 . 


97 


3 . 


87 


3 . 


79 


3 . 


73 


3 . 


68 


3 . 


64 


3 . 


57 


3 . 


51 


3 . 


44 


3 . 


27 


. 975 




8.07 


6 . 


54 


5.89 


5 . 


52 


5 . 


29 


5 . 


12 


4 . 


99 


4 . 


90 


4 . 


82 


4 . 


76 


4 . 


67 


4 . 


57 


4 . 


47 


4 . 


20 


.99 




12.2 


9 . 


55 


8.45 


7 . 


85 


7 . 


46 


7 . 


19 


6 . 


99 


6 . 


84 


6 . 


72 


6 . 


62 


6 . 


47 


6 . 


31 


6 . 


16 


5 . 


74 


995 




16.2 


12 


.4 


10.9 


10 


.1 


9 . 


52 


9 . 


16 


8 . 


89 


8 . 


68 


8 . 


51 


8 . 


38 


8 . 


18 


7 . 


97 


7 . 


75 


7 . 


19 


.95 


8 


5.32 


4 . 


46 


4.07 


3 . 


84 


3 . 


69 


3 . 


58 


3 . 


50 


3 . 


44 


3 . 


39 


3 . 


35 


3 . 


28 


3 . 


22 


3 . 


15 


2 . 


97 


. 975 




7.57 


6 . 


06 


5.42 


5 . 


05 


4 . 


82 


4 . 


65 


4 . 


53 


4 . 


43 


4 . 


36 


4 . 


30 


4 . 


20 


4 _ 


10 


4 . 


00 


3 . 


73 


.99 




11.3 


8 . 


65 


7.59 


7 . 


01 


6 . 


63 


6 . 


37 


6 . 


18 


6 . 


03 


5 . 


91 


5 . 


81 


5 . 


67 


5 . 


52 


5 . 


36 


4 . 


95 


995 




14.7 


11 


.0 


9.60 


8 . 


81 


8 . 


30 


7 . 


95 


7 . 


69 


7 . 


50 


7 . 


34 


7 . 


21 


7 . 


01 


6 . 


81 


6 . 


61 


6 . 


06 


.95 


9 


5.12 


4 . 


26 


3.86 


3 . 


63 


3 . 


48 


3 . 


37 


3 . 


29 


3 . 


23 


3 . 


18 


3 . 


14 


3 . 


07 


3 . 


01 


2 . 


94 


2 . 


75 


.975 




7.21 


5 . 


71 


5.08 


4 . 


72 


4 . 


48 


4 . 


32 


4 . 


20 


4 . 


10 


4 . 


03 


3 . 


96 


3 . 


87 


3 . 


77 


3 . 


67 


3 . 


39 


.99 




10.6 


8 . 


02 


6.99 


6 . 


42 


6 . 


06 


5 . 


80 


5 . 


61 


5 . 


47 


5 . 


35 


5 . 


26 


5 . 


11 


4 . 


96 


4 . 


81 


4 . 


40 


.995 




13.6 


10 


.1 


8.72 


7 . 


96 


7 . 


47 


7 . 


13 


6 . 


88 


6 . 


69 


6 . 


54 


6 . 


42 


6 . 


23 


6 . 


03 


5 . 


83 


5 . 


30 
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APANDICE D 



TABLA DE LA DISTRIBUCION DE PROBABILIDADES F 



La tabla da Areas 1 - a y valores c=F l -a.r tales que 
P[F < c] = 1 - a Donde r, y r 2 son los grados de nbertad, 
ydonde E 0 ^ 2 .r, =y f i-a.r,.r, 




1 -a 


r 

2 


r 

i 


i 


2 


3 


4 


5 


6 


7 


8 


9 


10 


12 


15 


20 


120 


.95 


10 


4.96 


4.10 


3.71 


3.48 


3.33 


3.22 


3.14 


3.07 


3.02 


2 . 98 


2.91 


2.84 


2.77 


2.58 


.975 




6.94 


5.46 


4.83 


4.47 


4.24 


4.07 


3.95 


3.85 


3.78 


3.72 


3.62 


3.52 


3.42 


3.14 


. 99 




10.0 


7.56 


6.55 


5 99 


5.64 


5.39 


5.20 


5.06 


4.94 


4.85 


4.71 


4.56 


4.41 


4.00 


. 995 




12.8 


9.43 


8.08 


7.34 


6.87 


6.54 


6.30 


6.12 


5.97 


5.85 


5.66 


5.47 


5.27 


4.75 


.95 


12 


4.75 


3.89 


3.49 


3.26 


3 . 11 


3.00 


2 91 


2.85 


2.80 


2.75 


2.69 


2.62 


2.54 


2.34 


.975 




6.55 


5.10 


4.47 


4.12 


3.89 


3.73 


3.61 


3.51 


3.44 


3.37 


3.28 


3.18 


3.07 


2.79 


.99 




9.33 


6.93 


5.95 


5.41 


5.06 


4.82 


4.64 


4.50 


4.39 


4.30 


4.16 


4.01 


3.86 


3.45 


.995 




11.8 


8.51 


7.23 


6.52 


6.07 


5.76 


5.52 


5.35 


5.20 


5.09 


4.91 


4.72 


4.53 


4.01 


.95 


15 


4.54 


3.68 


3.29 


3.06 


2.90 


2.79 


2.71 


2.64 


2.59 


2.54 


2 . 48 


2.40 


2.33 


2.11 


.975 




6.20 


4.77 


4.15 


3.80 


3.58 


3.41 


3.29 


3.20 


3.12 


3.06 


2.96 


2.86 


2.76 


2.46 


. 99 




8.68 


6.36 


5.42 


4 . 89 


4.56 


4.32 


4.14 


4.00 


3.89 


3.80 


3 . 67 


3.52 


3.37 


2.96 


.995 




10.8 


7.70 


6.48 


5.80 


5.37 


5.07 


4.85 


4.67 


4.54 


4.42 


4.25 


4.07 


3.88 


3.37 


.95 


20 


4.35 


3.49 


3.10 


2.87 


2.71 


2.60 


2.51 


2.45 


2.39 


2.35 


2.28 


2.20 


2.12 


1 90 


.975 




5.87 


4.46 


3.86 


3.51 


3.29 


3.13 


3.01 


2.91 


2 . 84 


2.77 


2.68 


2.57 


2.46 


2.16 


. 99 




8.10 


5.85 


4.94 


4.43 


4.10 


3.87 


3.70 


3.56 


3.46 


3.37 


3.23 


3.09 


2.94 


2.52 


.995 




9.94 


6.99 


5.82 


5.17 


4.76 


4.47 


4.26 


4,09 


3.96 


- 3.85 


3.68 


3.50 


3.32 


2.81 


.95 


30 


4.17 


3.32 


2.92 


2.69 


2.53 


2.42 


2.33 


2.27 


2.21 


2.16 


2.09 


2.01 


1.93 


1.68 


.975 




5.57 


4.18 


3.59 


3.25 


3.03 


2.87 


2.75 


2.65 


2.57 


2.51 


2.41 


2.31 


2.20 


1.87 


.99 




7.56 


5.39 


4.51 


4 . 02 


3.70 


3 47 


3.30 


3.17 


3 07 


2.98 


2.84 


2.70 


2.55 


2.11 


. 995 




9.18 


6.35 


5.24 


4.62 


4.23 


3.95 


3.74 


3.58 


3.45 


3.34 


3.18 


3.01 


2.82 


2.30 


.95 


60 


4.00 


3.15 


2.76 


2.53 


2.37 


2.25 


2.17 


2.10 


2.04 


1.99 


1.92 


1.84 


1.75 


1.47 


.975 




5.29 


3.93 


3.34 


3.01 


2.79 


2.63 


2.51 


2.41 


2.33 


2.27 


2.17 


2.06 


1.94 


1.58 


.99 




7.08 


4.98 


4.13 


3.65 


3.34 


3.12 


2.95 


2.82 


2.72 


2.63 


2 . 50 


2.35 


2.20 


1.73 


. 995 




8.49 


5.80 


4.73 


4.14 


3.76 


3.49 


3.29 


3.13 


3.01 


2 . 90 


2.74 


2.57 


2.39 


1.83 


.95 


120 


3.92 


3.07 


2.68 


2.45 


2.29 


2.18 


2.09 


2.02 


1.96 


1.91 


1.83 


1.75 


1.66 


1.35 


. 975 




5.15 


3.80 


3.23 


2.89 


2 . 67 


2.52 


2.39 


2.30 


2.22 


2.16 


2.05 


1.95 


1.82 


1.43 


. 99 




6 85 


4.79 


3.95 


3.48 


3.17 


2.96 


*.79 


2.66 


2.56 


2.47 


2.34 


2.19 


2 03 


1 53 


.995 




8.18 


5.54 


4.50 


3.92 


3.55 


3.28 


3.09 


2.93 


2.81 


2.71 


2.54 


2.37 


2.19 


1.61 


.95 


00 


3.84 


3.00 


2.60 


2.37 


2.21 


2.10 


2.01 


1.94 


1.88 


1.83 


1.75 


1.67 


1.57 


1.22 


.975 




5.02 


3.69 


3.12 


2.79 


2.57 


2.41 


2.29 


2.19 


2.11 


2.05 


1.94 


1.83 


1.71 


1.27 


.99 




6.63 


4 . 61 


3.78 


3.32 


3.02 


2.80 


2.64 


2.51 


2.41 


2.32 


2 18 


2.04 


1.88 


1.32 


.995 




7.88 


5.30 


4.28 


3.72 


3.35 


3.09 


2.90 


2.74 


2.62 


2.52 


2.36 


2.19 


2.00 


1.36 
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El use del mdtedo tienttfico para la solution de los problemas de 
estadistica requiere (idem as de los conotimientos bdsicos la fatilidad que 
le biin da un software adecuado, por ejemph el : 

MCEST: “Metodos Estadisticos Bdsicos” 

El MCEST es un paquete de computo diddctico creado por el autor de 
este texto, cuyos resultados son compatibles con los obtenidos utilizando 
lospaquetes: SPSS, ESTADISTICA, EXCEL, MINITAB, etc. 
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